“Dạy” máy tính hiểu được ngôn ngữ của con người

Trong khi việc làm chủ ngôn ngữ tự nhiên là dễ dàng đối với con người, nhưng nó là một cái gì đó mà máy tính vẫn chưa thể đạt được. Con người hiểu được ngôn ngữ thông qua nhiều cách khác nhau ví dụ là họ có thể là thông qua việc tra từ điển, hoặc bằng cách kết hợp nó với các từ trong cùng câu một theo đúng nghĩa.

Các thuật toán sẽ cho phép máy tính hoạt động theo nhiều cách tương tự như một con người khi bắt gặp một từ lạ. Theo đó khi máy tính bắt gặp một từ nó không nhận ra hoặc không hiểu, thuật toán này có nhiệm vụ đi tìm kiếm từ đó trong một cuốn từ điện (như từ điển Word Net), và cố gắng đoán xem các từ khác nào có thể xuất hiện với từ này trong văn bản. Nó cung cấp cho máy tính sự đồng dạng với ngữ nghĩa học (semantic representations) cho một từ, nghĩa là vừa phù hợp với ngữ nghĩa trong từ điển và vừa phù hợp với ngữ cảnh mà nó xuất hiện trong văn bản.

Để có thể biết xem liệu thuật toán có cung cấp cho máy tính với một đại diện chính xác của một từ hay không, nó sẽ so sánh các điểm tương đồng được tạo ra bằng cách sử dụng các từ đại diện đã được thuật toán máy tính “học” dựa trên các đặc điểm đồng dạng đã được tính toán của con người.

Tiến sĩ Danushka Bollegala, chuyên gia nghiên cứu máy tính tại Đại học Liverpool, cho biết: “Việc biết đại diện ngữ nghĩa chính xác của một từ là bước đi đầu tiên hướng đến việc dạy các ngôn ngữ cho máy tính. Nếu chúng ta có thể biểu hiện nghĩa cho một từ theo một cách một máy tính có thể hiểu được, sau đó máy tính sẽ có thể đọc được các văn bản thay cho con người và thực hiện các nhiệm vụ lợi ích tiềm năng như dịch một văn bản viết bằng ngôn ngữ nước ngoài, tổng kết một bài báo dài, hoặc tìm các tài liệu tương tự khác từ Internet. Chúng tôi rất hào hứng chờ đợi để xem khả năng to lớn đó sẽ mang lại khi có thể sử dụng máy tính thực hiện hàng loạt các nhiệm vụ xử lý ngôn ngữ”.

P.T.T