44 thuật ngữ AI mà mọi người nên biết

Thanh Thúy

Well-known member
Với việc Google, Microsoft, Meta và gần như mọi công ty khác tham gia vào lĩnh vực AI, thật khó để theo kịp thuật ngữ mới nhất. Bảng thuật ngữ AI dưới đây giúp bạn giải thích phần nào.


1716018303983.png


ChatGPT có thể là AI đầu tiên bạn tiếp cận. Chatbot AI từ OpenAI, một công ty khởi nghiệp, đã gây ấn tượng với khả năng trả lời mọi câu hỏi và hỗ trợ bạn trong việc làm bài tập làm văn, viết sơ yếu lý lịch và công thức nấu ăn... Sức mạnh của ChatGPT thậm chí còn được so sánh với chức năng tự động hoàn thành cực kỳ mạnh mẽ.

Tuy nhiên, khía cạnh này của chatbot AI chỉ là một phần nhỏ trong thế giới AI rộng lớn. Việc sử dụng ChatGPT để giải quyết bài tập về nhà hay yêu cầu Midjourney tạo ra những hình ảnh độc đáo quả là thú vị, nhưng tiềm năng của AI còn lớn hơn nhiều, có khả năng tái định hình nền kinh tế. Theo Viện McKinsey Toàn cầu, tiềm năng này có thể đạt giá trị lên đến 4,4 nghìn tỷ USD cho nền kinh tế toàn cầu mỗi năm, đó là lý do tại sao AI sẽ ngày càng được chú ý hơn.

AI hiện diện trong một loạt sản phẩm đa dạng, bao gồm Gemini của Google, Copilot của Microsoft, Claude của Anthropic, công cụ tìm kiếm AI Perplexity và các ứng dụng của Humane và Rabbit. Khi mọi người ngày càng quen thuộc với một thế giới AI, các thuật ngữ mới sẽ trở nên phổ biến. Vì vậy, dù bạn đang muốn tỏ ra thông thái trong buổi tiệc rượu hay muốn gây ấn tượng trong cuộc phỏng vấn xin việc, đây là một số thuật ngữ AI quan trọng mà bạn cần biết.

trí tuệ nhân tạo tổng hợp, hay AGI - artificial general intelligence (AGI): Một khái niệm gợi ý về một phiên bản AI tiên tiến hơn chúng ta biết ngày nay, một phiên bản có thể thực hiện các nhiệm vụ tốt hơn nhiều so với con người đồng thời giảng dạy và nâng cao khả năng của chính nó.

Đạo đức AI - AI ethics: Các nguyên tắc nhằm ngăn chặn AI làm hại con người, đạt được thông qua các biện pháp như xác định cách hệ thống AI nên thu thập dữ liệu hoặc xử lý sự thiên vị.

An toàn AI - AI safety: Một lĩnh vực liên ngành liên quan đến tác động lâu dài của AI và làm thế nào nó có thể đột ngột phát triển thành siêu trí thông minh có thể gây thù địch với con người.

thuật toán - algorithm: Một loạt các hướng dẫn cho phép chương trình máy tính tìm hiểu và phân tích dữ liệu theo một cách cụ thể, chẳng hạn như nhận dạng các mẫu, để sau đó học hỏi từ nó và tự mình hoàn thành các nhiệm vụ.

tinh chỉnh - alignment: Tinh chỉnh AI để tạo ra kết quả mong muốn tốt hơn. Điều này có thể đề cập đến bất cứ điều gì từ việc kiểm duyệt nội dung đến duy trì những tương tác tích cực với con người.

thuyết nhân hình - anthropomorphism: Khi con người có xu hướng gán cho những vật thể không phải con người những đặc điểm giống con người. Trong AI, điều này có thể bao gồm việc tin rằng chatbot giống con người hơn và có khả năng nhận thức cao hơn thực tế, như tin rằng nó đang vui, đang buồn hoặc thậm chí là có tri giác.

trí tuệ nhân tạo hoặc AI - artificial intelligence (AI): Việc sử dụng công nghệ để mô phỏng trí thông minh của con người, trong các chương trình máy tính hoặc robot. Một lĩnh vực khoa học máy tính nhằm mục đích xây dựng các hệ thống có thể thực hiện các nhiệm vụ của con người.

thiên vị - bias: Liên quan đến các mô hình ngôn ngữ lớn, các lỗi phát sinh từ dữ liệu huấn luyện. Điều này có thể dẫn đến việc gán sai một số đặc điểm nhất định cho các chủng tộc hoặc nhóm nhất định dựa trên khuôn mẫu.

chatbot: Một chương trình giao tiếp với con người thông qua văn bản mô phỏng ngôn ngữ của con người.

ChatGPT: Chatbot AI do OpenAI phát triển sử dụng công nghệ mô hình ngôn ngữ lớn.

điện toán nhận thức - cognitive computing: Một thuật ngữ khác cho trí tuệ nhân tạo.

tăng cường dữ liệu -data augmentation: Phối hợp lại dữ liệu hiện có hoặc thêm bộ dữ liệu đa dạng hơn để đào tạo AI.

học sâu - deep learning: Một phương pháp AI và một trường con của học máy, sử dụng nhiều tham số để nhận dạng các mẫu phức tạp trong hình ảnh, âm thanh và văn bản. Quá trình này được lấy cảm hứng từ bộ não con người và sử dụng mạng lưới thần kinh nhân tạo để tạo ra các mẫu.

khuếch tán - diffusion: Một phương pháp học máy lấy một phần dữ liệu hiện có, chẳng hạn như một bức ảnh, và thêm nhiễu ngẫu nhiên. Các mô hình khuếch tán huấn luyện mạng của họ để tái thiết kế hoặc khôi phục bức ảnh đó.

hành vi mới nổi - emergent behavior: Khi một mô hình AI thể hiện những khả năng ngoài ý muốn.

học từ đầu đến cuối, hay E2E - end-to-end learning, or E2E: Một quá trình học sâu trong đó một mô hình được hướng dẫn thực hiện một nhiệm vụ từ đầu đến cuối. Nó không được đào tạo để hoàn thành nhiệm vụ một cách tuần tự mà thay vào đó học hỏi từ các dữ liệu đầu vào và giải quyết tất cả cùng một lúc.

cân nhắc về mặt đạo đức - ethical considerations: Nhận thức về ý nghĩa đạo đức của AI và các vấn đề liên quan đến quyền riêng tư, sử dụng dữ liệu, tính công bằng, lạm dụng và các vấn đề an toàn khác.

foom: Còn được gọi là cất cánh nhanh hoặc cất cánh cứng. Khái niệm cho rằng nếu ai đó xây dựng AGI thì có thể đã quá muộn để cứu nhân loại.

mạng đối thủ tổng quát hoặc GAN - generative adversarial networks: Một mô hình AI tổng quát bao gồm hai mạng thần kinh để tạo ra dữ liệu mới: một trình tạo và một bộ phân biệt đối xử. Trình tạo tạo nội dung mới và trình phân biệt đối xử sẽ kiểm tra xem nội dung đó có xác thực hay không.

Generative AI: Công nghệ tạo nội dung sử dụng AI để tạo văn bản, video, mã máy tính hoặc hình ảnh. AI được cung cấp một lượng lớn dữ liệu đào tạo, tìm ra các mẫu để tạo ra phản hồi mới của riêng mình, đôi khi có thể giống với tài liệu nguồn.

Google Gemini: Một chatbot AI của Google có chức năng tương tự ChatGPT nhưng lấy thông tin từ trang web hiện tại, trong khi ChatGPT bị giới hạn dữ liệu cho đến năm 2021 và không được kết nối với Internet.

hành lang - guardrails: Các chính sách và hạn chế được đặt ra đối với các mô hình AI để đảm bảo dữ liệu được xử lý một cách có trách nhiệm và mô hình đó không tạo ra nội dung đáng lo ngại.

ảo giác - hallucination: Phản hồi không chính xác từ AI. Có thể bao gồm AI tổng hợp tạo ra các câu trả lời không chính xác nhưng được tuyên bố một cách tự tin như thể đúng. Những lý do cho điều này không hoàn toàn được biết đến. Ví dụ: khi hỏi một chatbot AI, "Leonardo da Vinci vẽ bức Mona Lisa khi nào?" nó có thể trả lời bằng một tuyên bố không chính xác rằng, "Leonardo da Vinci đã vẽ bức Mona Lisa vào năm 1815", tức là 300 năm sau khi bức tranh này thực sự được vẽ.

mô hình ngôn ngữ lớn hoặc LLM - large language model: Một mô hình AI được đào tạo trên lượng lớn dữ liệu văn bản để hiểu ngôn ngữ và tạo ra nội dung mới bằng ngôn ngữ giống con người.

học máy hoặc ML -machine learning: Một thành phần trong AI cho phép máy tính học hỏi và đưa ra kết quả dự đoán tốt hơn mà không cần lập trình rõ ràng. Có thể kết hợp với các bộ huấn luyện để tạo ra nội dung mới.

Microsoft Bing: Một công cụ tìm kiếm của Microsoft hiện có thể sử dụng công nghệ hỗ trợ ChatGPT để đưa ra kết quả tìm kiếm do AI cung cấp. Nó tương tự như Google Gemini ở chỗ được kết nối với internet.

AI đa phương thức - multimodal AI: Một loại AI có thể xử lý nhiều loại đầu vào, bao gồm văn bản, hình ảnh, video và giọng nói.

xử lý ngôn ngữ tự nhiên - natural language processing: Một nhánh của AI sử dụng machine learning và deep learning để cung cấp cho máy tính khả năng hiểu ngôn ngữ của con người, thường sử dụng các thuật toán học tập, mô hình thống kê và quy tắc ngôn ngữ.

mạng lưới thần kinh - neural network: Một mô hình tính toán giống với cấu trúc của bộ não con người và nhằm mục đích nhận dạng các mẫu trong dữ liệu. Bao gồm các nút hoặc nơ-ron được kết nối với nhau, có thể nhận ra các mẫu và học hỏi theo thời gian.

trang bị quá mức - overfitting: Lỗi trong học máy khi nó hoạt động quá gần với dữ liệu huấn luyện và chỉ có thể xác định được các ví dụ cụ thể trong dữ liệu đã nói chứ không phải dữ liệu mới.

kẹp giấy - paperclips: Lý thuyết Paperclip Maximiser, do triết gia Nick Boström của Đại học Oxford đặt ra, là một kịch bản giả định trong đó hệ thống AI sẽ tạo ra càng nhiều kẹp giấy theo nghĩa đen càng tốt. Với mục tiêu sản xuất số lượng kẹp giấy tối đa, hệ thống AI theo giả thuyết sẽ tiêu thụ hoặc chuyển đổi tất cả vật liệu để đạt được mục tiêu. Điều này có thể bao gồm việc tháo dỡ các máy móc khác để sản xuất nhiều kẹp giấy hơn, những máy móc có thể mang lại lợi ích cho con người. Hậu quả không lường trước của hệ thống AI này là nó có thể tiêu diệt loài người trong mục tiêu làm kẹp giấy.

tham số - parameters: Các giá trị số cung cấp cấu trúc và hành vi của LLM, cho phép nó đưa ra dự đoán.

câu lệnh - prompt: Gợi ý hoặc câu hỏi bạn nhập vào chatbot AI để nhận được phản hồi.

chuỗi lệnh - prompt chaining: Khả năng AI sử dụng thông tin từ các tương tác trước đó để tô màu cho các phản hồi trong tương lai.

con vẹt ngẫu nhiên - stochastic parrot: Một sự tương tự của LLM minh họa rằng phần mềm không có sự hiểu biết sâu sắc hơn về ý nghĩa đằng sau ngôn ngữ hoặc thế giới xung quanh nó, bất kể âm thanh đầu ra thuyết phục đến mức nào. Cụm từ này đề cập đến việc một con vẹt có thể bắt chước lời nói của con người mà không hiểu ý nghĩa đằng sau chúng.

chuyển kiểu - style transfer: Khả năng điều chỉnh kiểu của một hình ảnh với nội dung của hình ảnh khác, cho phép AI diễn giải các thuộc tính hình ảnh của một hình ảnh và sử dụng nó trên một hình ảnh khác. Ví dụ như lấy bức chân dung tự họa của Rembrandt và tái tạo nó theo phong cách Picasso.

nhiệt độ - temperature: Các tham số được đặt để kiểm soát mức độ ngẫu nhiên của đầu ra của mô hình ngôn ngữ. Nhiệt độ cao hơn có nghĩa là mô hình gặp nhiều rủi ro hơn.

tạo văn bản thành hình ảnh - text-to-image generation: Tạo hình ảnh dựa trên mô tả văn bản.

mã thông báo - tokens: Các đoạn văn bản nhỏ mà mô hình ngôn ngữ AI xử lý để hình thành phản hồi của chúng đối với lời nhắc của bạn. Mã thông báo tương đương với bốn ký tự bằng tiếng Anh hoặc khoảng 3/4 từ.

dữ liệu đào tạo - training data: Các bộ dữ liệu được sử dụng để giúp các mô hình AI học hỏi, bao gồm văn bản, hình ảnh, mã hoặc dữ liệu.

mô hình biến áp - transformer model: Kiến trúc mạng thần kinh và mô hình học sâu tìm hiểu ngữ cảnh bằng cách theo dõi các mối quan hệ trong dữ liệu, như trong câu hoặc các phần của hình ảnh. Vì vậy, thay vì phân tích từng từ một câu, nó có thể nhìn vào toàn bộ câu và hiểu ngữ cảnh.

Bài kiểm tra Turing - Turing test: Được đặt theo tên của nhà toán học và nhà khoa học máy tính nổi tiếng Alan Turing, nó kiểm tra khả năng của một cỗ máy để hành xử giống con người. Máy sẽ vượt qua nếu con người không thể phân biệt được phản ứng của máy với người khác.

AI yếu, hay còn gọi là AI hẹp - weak AI, aka narrow AI: AI tập trung vào một nhiệm vụ cụ thể và không thể học hỏi ngoài bộ kỹ năng của nó. Hầu hết AI ngày nay đều là AI yếu.

zero-shot learning: Một bài kiểm tra trong đó mẫu phải hoàn thành một nhiệm vụ mà không được cung cấp dữ liệu huấn luyện cần thiết. Một ví dụ là nhận ra một con sư tử khi chỉ được huấn luyện trên hổ.
 
Bên trên