Chúng ta không thể tin tưởng vào các hệ thống AI được xây dựng chỉ dựa trên Deep Learning

Chúng ta không thể tin tưởng vào các hệ thống AI được xây dựng chỉ dựa trên Deep Learning

Văn bản này không phải là kết quả của nghiên cứu khoa học mà là một trong nhiều ý kiến ​​liên quan đến sự phát triển công nghệ trước mắt của chúng ta. Và đồng thời là một lời mời thảo luận.

Gary Marcus, giáo sư tại Đại học New York, tin rằng deep learning đóng vai trò quan trọng trong sự phát triển của AI. Nhưng ông cũng tin rằng sự nhiệt tình quá mức đối với kỹ thuật này có thể khiến nó bị mất uy tín.

Trong cuốn sách của anh ấy Khởi động lại AI: Xây dựng trí tuệ nhân tạo mà chúng ta có thể tin tưởng Marcus, một nhà khoa học thần kinh được đào tạo bài bản, người đã xây dựng sự nghiệp về nghiên cứu AI tiên tiến, đề cập đến các khía cạnh kỹ thuật và đạo đức. Từ góc độ công nghệ, học sâu có thể bắt chước thành công các nhiệm vụ nhận thức mà bộ não chúng ta thực hiện, chẳng hạn như nhận dạng hình ảnh hoặc giọng nói. Nhưng đối với các nhiệm vụ khác, chẳng hạn như hiểu cuộc trò chuyện hoặc xác định mối quan hệ nhân quả, deep learning không phù hợp. Để tạo ra những cỗ máy thông minh tiên tiến hơn có thể giải quyết nhiều vấn đề hơn – thường được gọi là trí tuệ nhân tạo tổng quát – deep learning cần được kết hợp với các kỹ thuật khác.

Nếu một hệ thống AI không thực sự hiểu rõ nhiệm vụ của nó hoặc thế giới xung quanh nó, điều này có thể dẫn đến những hậu quả nguy hiểm. Ngay cả những thay đổi bất ngờ nhỏ nhất trong môi trường hệ thống cũng có thể dẫn đến hành vi sai sót. Đã có rất nhiều ví dụ như vậy: yếu tố quyết định cách diễn đạt không phù hợp, dễ bị đánh lừa; hệ thống tìm kiếm việc làm luôn phân biệt đối xử; những chiếc xe không người lái gặp tai nạn và đôi khi giết chết người lái hoặc người đi bộ. Tạo ra trí tuệ nhân tạo tổng hợp không chỉ là một vấn đề nghiên cứu thú vị mà nó còn có nhiều ứng dụng hoàn toàn thực tế.

Trong cuốn sách của họ, Marcus và đồng tác giả Ernest Davis tranh luận về một con đường khác. Họ tin rằng chúng ta vẫn còn lâu mới tạo ra được AI nói chung, nhưng họ tin tưởng rằng sớm hay muộn thì cũng có thể tạo ra được nó.

Tại sao chúng ta cần AI nói chung? Các phiên bản chuyên biệt đã được tạo ra và mang lại rất nhiều lợi ích.

Đúng vậy, và sẽ còn có nhiều lợi ích hơn nữa. Nhưng có nhiều vấn đề mà AI chuyên biệt không thể giải quyết được. Ví dụ: hiểu lời nói thông thường hoặc hỗ trợ chung trong thế giới ảo hoặc robot giúp dọn dẹp và nấu ăn. Những nhiệm vụ như vậy vượt quá khả năng của AI chuyên dụng. Một câu hỏi thực tế thú vị khác: liệu có thể tạo ra một chiếc ô tô tự lái an toàn bằng AI chuyên dụng không? Kinh nghiệm cho thấy AI như vậy vẫn gặp nhiều vấn đề về hành vi trong các tình huống bất thường, ngay cả khi đang lái xe, khiến tình hình trở nên phức tạp hơn rất nhiều.

Tôi nghĩ tất cả chúng ta đều muốn có AI có thể giúp chúng ta thực hiện những khám phá mới lớn trong y học. Không rõ liệu các công nghệ hiện tại có phù hợp cho việc này hay không vì sinh học là một lĩnh vực phức tạp. Bạn cần phải chuẩn bị để đọc nhiều sách. Các nhà khoa học hiểu được mối quan hệ nhân quả trong sự tương tác của mạng lưới và phân tử, có thể phát triển các lý thuyết về các hành tinh, v.v. Tuy nhiên, với AI chuyên dụng, chúng ta không thể tạo ra những cỗ máy có khả năng khám phá như vậy. Và với AI nói chung, chúng ta có thể cách mạng hóa khoa học, công nghệ và y học. Theo tôi, điều rất quan trọng là tiếp tục nỗ lực tạo ra AI nói chung.

Nghe có vẻ như “chung” ý bạn là AI mạnh?

Khi nói “nói chung”, ý tôi là AI sẽ có thể suy nghĩ và giải quyết các vấn đề mới một cách nhanh chóng. Không giống như cờ vây, vấn đề không hề thay đổi trong suốt 2000 năm qua.

AI nói chung sẽ có thể đưa ra quyết định về cả chính trị và y học. Điều này tương tự như khả năng của con người; bất cứ người tỉnh táo nào cũng có thể làm được rất nhiều việc. Bạn nhận những sinh viên thiếu kinh nghiệm và trong vòng vài ngày, họ sẽ làm được hầu hết mọi việc, từ vấn đề pháp lý đến vấn đề y tế. Điều này là do họ có hiểu biết chung về thế giới và có thể đọc, do đó có thể đóng góp vào rất nhiều hoạt động.

Mối quan hệ giữa trí thông minh như vậy và trí thông minh mạnh mẽ là một trí thông minh không mạnh mẽ có thể sẽ không giải quyết được các vấn đề chung. Để tạo ra thứ gì đó đủ mạnh mẽ để đối phó với một thế giới luôn thay đổi, ít nhất bạn có thể cần phải tiếp cận trí thông minh tổng quát.

Nhưng bây giờ chúng ta đã ở rất xa điều này. AlphaGo có thể chơi hoàn toàn tốt trên bàn cờ 19x19, nhưng nó cần được đào tạo lại để chơi trên bàn cờ hình chữ nhật. Hoặc lấy hệ thống học sâu trung bình: nó có thể nhận ra một con voi nếu nó được chiếu sáng tốt và có thể nhìn thấy được kết cấu da của nó. Và nếu chỉ nhìn thấy hình bóng của một con voi, hệ thống có thể sẽ không thể nhận ra nó.

Trong cuốn sách của bạn, bạn đề cập rằng deep learning không thể đạt được khả năng của AI nói chung vì nó không có khả năng hiểu sâu.

Trong khoa học nhận thức, họ nói về sự hình thành các mô hình nhận thức khác nhau. Tôi đang ngồi trong phòng khách sạn và tôi hiểu rằng có một cái tủ, một cái giường, một cái TV được treo một cách khác thường. Tôi biết tất cả những đồ vật này, tôi không chỉ nhận dạng chúng. Tôi cũng hiểu chúng được kết nối với nhau như thế nào. Tôi có những ý tưởng về sự vận hành của thế giới xung quanh tôi. Họ không hoàn hảo. Họ có thể sai, nhưng họ khá tốt. Và dựa trên đó, tôi đưa ra rất nhiều kết luận trở thành kim chỉ nam cho hành động hàng ngày của mình.

Một thái cực khác giống như hệ thống trò chơi Atari do DeepMind xây dựng, trong đó nó ghi nhớ những gì nó cần làm khi nhìn thấy các pixel ở một số vị trí nhất định trên màn hình. Nếu lấy đủ dữ liệu, bạn có thể cho rằng mình có hiểu biết nhưng thực tế lại rất hời hợt. Bằng chứng cho điều này là nếu bạn di chuyển các vật thể theo ba pixel, AI sẽ chơi tệ hơn nhiều. Những thay đổi khiến anh bối rối. Điều này trái ngược với sự hiểu biết sâu sắc.

Để giải quyết vấn đề này, bạn đề xuất quay lại AI cổ điển. Chúng ta nên cố gắng tận dụng những lợi thế nào?

Có một số lợi thế.

Đầu tiên, AI cổ điển thực sự là một khuôn khổ để tạo ra các mô hình nhận thức về thế giới, dựa vào đó có thể rút ra kết luận.

Thứ hai, AI cổ điển hoàn toàn tương thích với các quy tắc. Hiện nay có một xu hướng kỳ lạ trong lĩnh vực học sâu là các chuyên gia đang cố gắng né tránh các quy tắc. Họ muốn làm mọi thứ trên mạng lưới thần kinh và không làm bất cứ điều gì giống như lập trình cổ điển. Nhưng có những vấn đề được giải quyết một cách êm ả theo cách này nhưng không ai để ý đến. Ví dụ: xây dựng các tuyến đường trong Google Maps.

Trên thực tế, chúng ta cần cả hai cách tiếp cận. Học máy rất giỏi trong việc học từ dữ liệu nhưng lại rất kém trong việc thể hiện sự trừu tượng của một chương trình máy tính. AI cổ điển hoạt động tốt với các khái niệm trừu tượng, nhưng nó phải được lập trình hoàn toàn bằng tay và có quá nhiều kiến ​​thức trên thế giới để lập trình tất cả. Rõ ràng chúng ta cần kết hợp cả hai cách tiếp cận.

Điều này gắn liền với chương mà bạn nói về những gì chúng ta có thể học được từ tâm trí con người. Và trước hết, về khái niệm dựa trên ý tưởng đã nêu ở trên rằng ý thức của chúng ta bao gồm nhiều hệ thống khác nhau hoạt động theo những cách khác nhau.

Tôi nghĩ một cách khác để giải thích điều này là mỗi hệ thống nhận thức của chúng ta thực sự giải quyết được một vấn đề khác nhau. Các phần tương tự của AI phải được thiết kế để giải quyết các vấn đề khác nhau có những đặc điểm khác nhau.

Bây giờ chúng tôi đang cố gắng sử dụng một số công nghệ tất cả trong một để giải quyết các vấn đề hoàn toàn khác nhau. Hiểu một câu hoàn toàn không giống như nhận ra một đối tượng. Nhưng mọi người đang cố gắng sử dụng deep learning trong cả hai trường hợp. Từ quan điểm nhận thức, đây là những nhiệm vụ khác nhau về mặt chất lượng. Tôi chỉ đơn giản là ngạc nhiên khi thấy có rất ít sự đánh giá cao dành cho AI cổ điển trong cộng đồng deep learning. Tại sao phải đợi viên đạn bạc xuất hiện? Nó là không thể đạt được và những cuộc tìm kiếm không có kết quả không cho phép chúng ta hiểu được toàn bộ sự phức tạp của nhiệm vụ tạo ra AI.

Bạn cũng đề cập rằng cần có hệ thống AI để hiểu mối quan hệ nhân quả. Bạn nghĩ deep learning, AI cổ điển hay thứ gì đó hoàn toàn mới sẽ giúp chúng ta làm điều này?

Đây là một lĩnh vực khác mà deep learning không phù hợp lắm. Nó không giải thích nguyên nhân của một số sự kiện nhất định nhưng tính toán xác suất của một sự kiện trong những điều kiện nhất định.

Chúng ta đang nói về điều gì vậy? Bạn xem một số tình huống nhất định và bạn hiểu tại sao điều này xảy ra cũng như điều gì có thể xảy ra nếu một số tình huống thay đổi. Tôi có thể nhìn vào cái chân đế đặt TV và tưởng tượng rằng nếu tôi cắt bỏ một chân của nó, cái chân đế sẽ lật và TV sẽ rơi. Đây là mối quan hệ nhân quả.

AI cổ điển cung cấp cho chúng ta một số công cụ cho việc này. Chẳng hạn, anh ta có thể tưởng tượng thế nào là hỗ trợ và thế nào là ngã. Nhưng tôi sẽ không khen ngợi quá mức. Vấn đề là AI cổ điển phần lớn phụ thuộc vào thông tin đầy đủ về những gì đang xảy ra và tôi đã đưa ra kết luận chỉ bằng cách nhìn vào giá đỡ. Bằng cách nào đó tôi có thể khái quát, tưởng tượng ra những phần của khán đài mà tôi không nhìn thấy được. Chúng tôi chưa có công cụ để triển khai thuộc tính này.

Bạn còn nói con người có kiến ​​thức bẩm sinh. Làm thế nào điều này có thể được thực hiện trong AI?

Vào thời điểm mới sinh ra, bộ não của chúng ta đã là một hệ thống rất phức tạp. Nó không cố định; thiên nhiên đã tạo ra bản phác thảo thô sơ đầu tiên. Và việc học tập sẽ giúp chúng ta ôn lại bản thảo đó trong suốt cuộc đời.

Một bản phác thảo thô của bộ não đã có những khả năng nhất định. Một con dê núi mới sinh có thể xuống sườn núi một cách chính xác trong vòng vài giờ. Rõ ràng là anh ấy đã có hiểu biết về không gian ba chiều, cơ thể của anh ấy và mối quan hệ giữa chúng. Một hệ thống rất phức tạp.

Đây là một phần lý do tại sao tôi tin rằng chúng ta cần giống lai. Thật khó để tưởng tượng làm thế nào người ta có thể tạo ra một robot hoạt động tốt trong một thế giới không có kiến ​​thức tương tự về việc bắt đầu từ đâu, thay vì bắt đầu từ một bảng trống và học hỏi từ kinh nghiệm lâu dài, rộng lớn.

Đối với con người, kiến ​​thức bẩm sinh của chúng ta đến từ bộ gen đã tiến hóa trong một thời gian dài. Nhưng với hệ thống AI, chúng ta sẽ phải đi một con đường khác. Một phần của điều này có thể là các quy tắc xây dựng thuật toán của chúng tôi. Một phần của điều này có thể là các quy tắc tạo cấu trúc dữ liệu mà các thuật toán này thao tác. Và một phần trong số này có thể là kiến ​​thức mà chúng ta sẽ đầu tư trực tiếp vào máy móc.

Điều thú vị là trong cuốn sách này bạn đưa ra ý tưởng về lòng tin và việc tạo ra các hệ thống tin cậy. Tại sao bạn chọn tiêu chí cụ thể này?

Tôi tin rằng ngày nay tất cả những điều này chỉ là một trò chơi bóng. Đối với tôi, có vẻ như chúng ta đang trải qua một thời điểm kỳ lạ trong lịch sử, tin tưởng rất nhiều phần mềm không đáng tin cậy. Tôi nghĩ những lo lắng mà chúng ta có ngày hôm nay sẽ không kéo dài mãi mãi. Trong một trăm năm nữa, AI sẽ chứng minh được niềm tin của chúng ta và thậm chí có thể sớm hơn.

Nhưng ngày nay AI rất nguy hiểm. Không phải theo nghĩa mà Elon Musk lo sợ, mà theo nghĩa là các hệ thống phỏng vấn xin việc phân biệt đối xử với phụ nữ, bất kể lập trình viên làm gì, bởi vì công cụ của họ quá đơn giản.

Tôi ước chúng ta có AI tốt hơn. Tôi không muốn chứng kiến ​​một “Mùa đông AI” nơi mọi người nhận ra rằng AI không hoạt động và chỉ đơn giản là nguy hiểm và không muốn sửa chữa nó.

Ở một khía cạnh nào đó, cuốn sách của bạn có vẻ rất lạc quan. Bạn cho rằng có thể xây dựng AI đáng tin cậy. Chúng ta chỉ cần nhìn theo một hướng khác.

Đúng vậy, cuốn sách rất bi quan trong ngắn hạn và rất lạc quan trong dài hạn. Chúng tôi tin rằng tất cả các vấn đề chúng tôi đã mô tả có thể được giải quyết bằng cách xem xét rộng hơn xem đâu là câu trả lời đúng. Và chúng tôi nghĩ rằng nếu điều này xảy ra, thế giới sẽ trở thành một nơi tốt đẹp hơn.

Nguồn: www.habr.com

Thêm một lời nhận xét