Các khái niệm cơ bản về AI
AI (artificial intelligence hay trí tuệ nhân tạo) vốn không phải là một khái niệm mới. Từ trước đó rất lâu, Google translate mọi người hay sử dụng, hoặc là những trợ lý ảo trên điện thoại, đều là ứng dụng của AI. Tuy nhiên, từ khi OpenAI ra mắt ChatGPT, thì AI mới dành được nhiều sự chú ý từ cộng đồng.
AI đã được ứng dụng và thảo luận nhiều ở các khía cạnh và ngành nghề khác như kinh tế, giáo dục, … nhưng những tài liệu để áp dụng trong lĩnh vực y dược còn hạn chế
Bài viết nằm trong chuỗi bài viết học cách ứng dụng AI vào trong lĩnh vực y dược, một lĩnh vực yêu cầu độ chính xác cao nhưng chưa có nhiều hướng dẫn áp dụng thực hành, được thực hiện sau khoá học cùng MedLang Fantastic.
Hiểu về cách AI vận hành
AI hoạt động dựa trên mô hình học máy, cụ thể là mô hình ngôn ngữ lớn (Large Language Models – LLM), được huấn luyện từ hàng triệu câu văn bản. Trong quá trình huấn luyện, chúng không học trực tiếp cả một văn bản hoặc một câu văn dài, mà tách văn bản/câu văn đó thành những mảnh từ khoá, như những dữ liệu, và ghi nhớ cách các mảnh dữ liệu được liên kết với nhau. Vì dữ liệu được sử dụng để đào tạo AI rất lớn, tạo nên một mạng lưới khổng lồ thông tin.
Và AI (ví dụ là ChatGPT) học cách dự đoán từ tiếp theo dựa trên ngữ cảnh của các từ trước đó trong câu. Khi người dùng nhập vào một câu hỏi hoặc yêu cầu, chúng sẽ sử dụng kiến thức đã được học để đưa ra câu trả lời phù hợp bằng cách chọn các từ và cụm từ có xác suất phù hợp nhất cao nhất. Từ thông tin đầu vào là câu hỏi của chúng mình, AI sẽ chia nhỏ các từ ra thành các mẩu dữ liệu, so sánh và đối chiếu với những dữ liệu đã được đào tạo, và lựa chọn ra từ có xác suất cao nhất. Từ thứ nhất, rùi thứ hai, rùi thứ ba,… cứ lần lượt vậy tới khi hoàn thiện câu trả lời.
Ví dụ, khi bắt đầu học một điều gì đó, chúng mình nhận được câu hỏi, chúng mình thường trả lời kiểu “Hôm trước thầy giảng như thế này…”, hoặc là “Hôm trước tao đọc được trong sách như thế này…”. Tuy nhiên, sau khi học được một thời gian đủ lâu, chúng mình có thể tổng hợp cả thông tin của thầy và của sách, hoặc có thể từ nơi nào đó trên Internet nữa (mà chúng mình tin là nó có phần nào đó đúng) để đưa ra câu trả lời của chúng mình. AI cũng vậy, chỉ là mình dựa nhiều vào suy luận logic và (có thể là) cảm tính trong não bộ, AI dựa vào xác xuất thống kê.
Vì lý do đó, những câu trả lời của AI là câu trả lời được chúng dự đoán có xác xuất xảy ra cao nhất, trong bộ dữ liệu chúng đã được đào tạo. Và, do không thể học từ những tương tác thực tế mà chỉ từ lần huấn luyện cố định, AI không tự cập nhật kiến thức mà phải được huấn luyện lại để tích hợp thông tin mới. Điều này khiến chúng phù hợp cho các câu hỏi dạng mẫu, nhưng có thể gặp khó khăn với các câu hỏi yêu cầu kiến thức cập nhật hoặc phức tạp hơn.
Từ Input thành Output – Prompts
Prompts là câu lệnh, những cái mình gửi cho AI để AI có thể hiểu được mình muốn gì. Viết một câu prompt tốt là điều vô cùng quan trọng để nhận được một kết quả tốt từ AI.
Thì cũng tương tự yêu đương, hãy yêu người khác theo cách của họ, đừng chỉ yêu theo cách của mình. Vì đôi khi, có thể không phải người ta không có yêu mình, mà người ta không có đọc được suy nghĩ của mình vậy đó. Lúc mà hiểu nhau rùi, thì kết quả cũng tốt thui à. Yêu ấy hả, thật ra là hành trình để hiểu nhau, cả những điểm xấu xí kinh khủng, mà vẫn chọn ở bên nhau, để cùng nhau trở nên tốt hơn mỗi ngày.
Trong quá trình tương tác, nếu output của mình không tốt, thì rất có thể do câu lệnh của chúng mình không tốt, chứ chưa hẳn là do bản thân chiếc AI đó không thể đưa được cho mình câu trả lời tốt.
Những hạn chế của AI
Những điểm yếu cố hữu mà gần như có thể là AI nào cũng có thể gặp phải
Hallucination – Ảo giác
Trong Y Văn định nghĩa, Ảo giác (Hallucination) là tình trạng giác quan bị rối loạn, người trong cuộc tưởng như mình nghe thấy, nhìn thấy, cảm thấy những việc mà thực tế lại không có thật.
Vì chỉ dựa vào các mẩu dữ liệu để đưa ra câu trả lời, thay vì hiểu biết thật sự về vấn đề, AI thường tạo ra những câu trả lời không chính xác hoặc thiếu căn cứ. Lý do đôi khi vì những thông tin đó đã được liên kết bằng một cách nào đó trong bộ dữ liệu mà chúng được đào tạo (kiểu như là họ hàng rất rất xa, thực tế là không có họ hàng gì nhưng mà ráng ép cho có họ hàng vậy).
Trường hợp này thường xảy ra khi
- Dữ liệu được sử dụng để đào tạo AI không đủ chất lượng
- Prompts không tốt
- AI được yêu cầu nội dung ngoài những phần đã được đào tạo.
Thiếu tính minh bạch
Ví dụ điển hình là ChatGPT không thể cung cấp tài liệu tham khảo cho những câu trả lời. Do đó, người dùng khó có thể kiểm chứng được độ tin cậy.
Khi người dùng yêu cầu tài liệu tham khảo, ChatGPT tự tạo ra những tài liệu tham khảo. Tuy nhiên những tài liệu tham khảo này không tồn tại khi người dùng kiểm tra.
Do đó, ChatGPT hoặc những công cụ không cung cấp tài liệu tham khảo thì không phù hợp để sử dụng trong những trường hợp cần đưa ra những quyết định quan trọng trong chẩn đoán và điều trị.
Thiên lệch trong dữ liệu
Điều này đến từ sự thiên lệch trong dữ liệu đào tạo, dẫn đến việc lặp lại hoặc củng cố các định kiến không mong muốn, có thể dẫn đến hậu quả là Ai đưa ra những lời khuyên hoặc kiến thức sai lệch.
Trong Y Khoa, có nhiều những vùng xám (tức là vùng cân nhắc can thiệp, hoặc chờ đợi can thiệp, tuỳ thuộc vào từng bệnh nhân và trường hợp cụng thể), và sự khác nhau trong quan điểm chẩn đoán và điều trị được đề cập ở các guidelines của các nước và các châu lục khá là phổ biến. Có thể khắc phục điều này bằng cách viết prompts tốt hơn, đề cập tới đối tượng bệnh nhân đang được tác động, thì có thể giảm bớt sự thiên lệch này.
Nhưng nếu bản chất đến từ bộ dữ liệu, tức là không có đầy đủ thông tin để đào tạo, hoặc bộ dữ liệu đào tạo quá ít, thì thật sự là cũng khó. Lúc này thì thử một bạn AI khác thử.
Tính ngẫu nhiên của câu trả lời
Những câu trả lời của AI không đồng nhất và không hoàn toàn giống nhau.
Ví dụ khi lựa chọn kháng sinh cho người bệnh. Có thể lựa chọn 4 loại kháng sinh. Nhưng khi hỏi AI, và chúng được train để đưa ra câu trả lời theo câu hỏi của người dùng, nên đôi khi, chúng lựa chọn ngẫu nhiên từ bộ dữ liệu đã được đào tạo, để đưa ra một đáp án duy nhất (mà không phải là tổng quan 4 đáp án). Và ở một thời điểm khác, dù với cùng câu lệnh Prompt, chúng đưa ra một đáp án khác.
Điều này dẫn đến tính thiếu nhất quán trong câu trả lời của AI. Do chúng chỉ là thuật toán và xác suất chứ không phải là kiến thức của AI.
Các nguyên tắc khi sử dụng AI
Để có được một kết quả tốt
- Hiểu rõ mục đích của mình và đặc điểm của công cụ AI mình đang sử dụng, để giao đúng người đúng việc
- Sử dụng Prompt (dù là cơ bản hay nâng cao) một cách hiệu quả
- Có kiến thức nền hoặc có cách kiểm tra để loại trừ những hạn chế cố hữu của AI
Cấu trúc của một Prompts tốt?
Gồm: (Các thành phần được nêu từ rất quan trọng tới ít quan trọng hơn)
- [Task] Định nghĩa mục đích của bạn một cách rõ ràng (để AI có thể hiểu)
- [Context] Nêu bối cảnh của công việc bạn yêu cầu AI làm (Ví dụ, bối cảnh lâm sàng)
- [Examples] Ví dụ mẫu. “Tham khảo mẫu sau…”
- [Persona] Hình dung AI là ai, đóng vai là chuyên gia trong lĩnh vực đó, ví dụ, bác sĩ tim mạch, hoặc là kỹ sư
- [Format] Yêu cầu cụ thể dạng output mà mình muốn (Bảng biểu, hoặc là danh sách,…)
- [Tone] Giọng văn yêu cầu, ví dụ Academic, hoặc giọng văn cuộc sống hằng ngày
Tổng kết
Hiểu rõ mục đích của mình và công cụ AI mà mình đang sử dụng, kết hợp với đặt một câu lệnh prompt tốt, là khởi đầu để có một cuộc trò chuyện suôn sẻ và hiệu quả với AI.
Tài liệu tham khảo
Bài viết nằm trong thử thách viết 30 ngày của Writing On The Net 7
#wotn7
2 Comments
Lê Hoàn Phương Thảo
giao tiếp với AI cũng giống như giao tiếp người với người vậy, rõ ràng thông điệp và mục đích. Thích câu liên tưởng này của c quá “Thì cũng tương tự yêu đương, hãy yêu người khác theo cách của họ, đừng chỉ yêu theo cách của mình. Vì đôi khi, có thể không phải người ta không có yêu mình, mà người ta không có đọc được suy nghĩ của mình vậy đó. Lúc mà hiểu nhau rùi, thì kết quả cũng tốt thui à. Yêu ấy hả, thật ra là hành trình để hiểu nhau, cả những điểm xấu xí kinh khủng, mà vẫn chọn ở bên nhau”
Ánh Kim
Đang ngồi viết bon tự nhiên nghĩ ra nên thêm vào cho thêm phần thú zị ạ ^^