Tại sao trí thông minh thực sự của con người là chìa khóa cho sự phát triển của AI

Trong bối cảnh phát triển tuyệt vời của trí tuệ nhân tạo, điều quan trọng đối với các nhà khoa học dữ liệu là dựa vào suy nghĩ phê phán của chính họ và không chỉ chuyển mọi thứ sang máy móc.
Những phát triển đã nhanh chóng và tức giận trong những tháng gần đây. Microsoft tuyên bố sẽ đầu tư 1 tỷ USD vào quan hệ đối tác với phòng thí nghiệm nghiên cứu OpenAI để tạo ra trí thông minh chung nhân tạo (AGI), chén thánh của trí tuệ nhân tạo. Giám đốc điều hành của OpenAI, Sam Altman, đã khoe rằng, việc tạo ra AGI sẽ là sự phát triển công nghệ quan trọng nhất trong lịch sử loài người.

Máy tính có thể thực hiện nhiều nhiệm vụ rất cụ thể tốt hơn nhiều so với con người, nhưng chúng không có bất cứ thứ gì từ xa giống với trí tuệ, lẽ thường và suy nghĩ phê phán mà con người sử dụng để xử lý các tình huống không rõ ràng, các quy tắc mơ hồ và các mục tiêu mơ hồ, thậm chí mâu thuẫn . Sự phát triển của máy tính có thể làm mọi thứ mà bộ não con người làm sẽ rất đáng kinh ngạc, nhưng hồ sơ của Microsoft không đáng khích lệ.
Vào năm 2016, Microsoft đã phát hành Tay (Tư duy về bạn Giới tính), một chatbot mà Microsoft quảng cáo là Được thiết kế để thu hút và giải trí mọi người nơi họ kết nối trực tuyến với nhau thông qua cuộc trò chuyện ngẫu nhiên và vui vẻ. Tay được lập trình để trở thành một phụ nữ ngàn năm bằng cách học bắt chước ngôn ngữ được sử dụng bởi các thiên niên kỷ. Microsoft khoe rằng, bạn càng trò chuyện với Tay, cô ấy càng thông minh hơn. Chưa đầy một ngày, Tay đã gửi 96.000 tweet và có hơn 50.000 người theo dõi. Vấn đề là Tay trở thành một chatbot đáng khinh, tweet những điều như, Hồi Hitler đúng là tôi ghét người Do Thái, Cuộc sống ngày 9/11 là một công việc nội bộ, Hồi và Hồi tôi ghét nữ quyền. Tay rất giỏi trong việc tái chế các từ và cụm từ mà nó nhận được, nhưng nó không có cách nào để đặt các từ trong ngữ cảnh hoặc hiểu các tweet mà nó đang gửi. Microsoft đã lấy Tay ngoại tuyến sau 16 giờ, nhưng một tuần sau, Tay đã trở lại trực tuyến và sớm đặt mình vào một vòng lặp vô tận, tweet, Bạn quá nhanh, xin hãy nghỉ ngơi, nhiều lần, liên tục phá vỡ cuộc sống của hơn 200.000 người theo dõi Twitter. Microsoft tuyên bố rằng việc phát hành lại là một tai nạn và đưa Tay ngoại tuyến trở lại.
AGI có thể là một giấc mơ hão huyền, nhưng khoa học dữ liệu cung cấp cơ hội thực tế để sử dụng dữ liệu lớn và máy tính mạnh mẽ để đưa ra quyết định dựa trên sự thật thay vì lười suy nghĩ, ý thích, linh cảm và định kiến. Thật không may, thực tế là các doanh nghiệp và chính phủ vẫn đang mắc nhiều lỗi tương tự đã xảy ra trước khi bắt đầu xóa dữ liệu, nhưng bây giờ họ đang làm cho chúng nhanh hơn nhiều. Chuyển các quyết định quan trọng sang máy móc chỉ tự động hóa các sai lầm.
Khoa học dữ liệu không chỉ là bằng chứng toán học, tính toán thống kê và lập trình máy tính. Trí thông minh thực sự của con người là điều cần thiết: thiết kế thử nghiệm, trí tuệ, lẽ thường, sự hoài nghi và tư duy phản biện. Các nhà khoa học dữ liệu không nên cố gắng trở thành những cỗ máy, trong tất cả những vinh quang tìm kiếm mô hình, phù hợp với đường cong; họ nên cố gắng trở thành nhà khoa học.
Có chín cạm bẫy phổ biến cần tránh nếu khoa học dữ liệu có thể thực hiện tiềm năng to lớn của nó:
Sử dụng dữ liệu xấu . Charles Babbage, người phát minh ra máy tính cơ học đầu tiên, đã hai lần được hỏi bởi các thành viên của Nghị viện, ông Pray, ông Babbage, nếu bạn đưa vào máy những con số sai, liệu câu trả lời đúng có xuất hiện không? Dữ liệu tốt là bắt buộc, không phải là tùy chọn.
Một nghiên cứu trên bệnh nhân nhiễm trùng huyết tại bệnh viện Chicago đã kết luận rằng những bệnh nhân có nồng độ pH thấp trong máu sẽ ít có khả năng quay lại bệnh viện ngay sau khi được xuất viện. Mối tương quan là 0,96 quyết định. Tuy nhiên, dữ liệu bao gồm các bệnh nhân đã chết trong thời gian nằm viện! Những bệnh nhân ít có khả năng được nhận lại là những người đã được xuất viện. Khi người quá cố bị loại trừ, hóa ra bệnh nhân có giá trị pH thấp, trên thực tế, đang gặp nguy hiểm nghiêm trọng.

Đưa dữ liệu trước lý thuyết . Một số nhà khoa học dữ liệu lục soát dữ liệu cho các mẫu mà không được hướng dẫn bởi lý thuyết hoặc lẽ thường. Thật vậy, họ tin rằng suy nghĩ về một câu hỏi hạn chế khả năng khám phá kiến ​​thức. Thật không may, deluge dữ liệu đã bùng nổ số lượng các mẫu có thể được phát hiện, phần lớn trong số đó nhất thiết là vô nghĩa. Nghịch lý của dữ liệu lớn là càng nhiều dữ liệu chúng ta cướp đi các mẫu, thì càng có nhiều khả năng những gì chúng ta tìm thấy là vô giá trị hoặc tệ hơn.
Một nhà tiếp thị internet đã thử nghiệm ba màu thay thế cho trang đích của nó (vàng, đỏ và teal) so với màu xanh truyền thống của nó ở 100 quốc gia, điều này hầu như đảm bảo rằng họ sẽ tìm thấy sự gia tăng doanh thu cho một số màu cho một số quốc gia. Họ kết luận rằng nước Anh thích teal, ngoại trừ việc nó không.
Thờ cúng toán . Các nhà toán học yêu toán học và nhiều người không phải là nhà toán học bị đe dọa bởi toán học. Đây là một sự kết hợp gây chết người có thể dẫn đến việc tạo ra các mô hình phi thực tế.
Nhiều mô hình toán học về mặc định thế chấp đã sụp đổ trong cuộc Đại suy thoái vì họ đưa ra các giả định thuận tiện rằng cơ hội vỡ nợ thường được phân phối và độc lập. Họ đã đánh giá thấp cơ hội của các sự kiện cực đoan và không xem xét khả năng một sự kiện kinh tế vĩ mô như suy thoái kinh tế sẽ gây ra một đợt vỡ nợ thế chấp.

Thờ cúng máy tính . Thật hấp dẫn khi nghĩ rằng vì máy tính có thể làm một số thứ cực kỳ tốt, chúng phải rất thông minh, nhưng hữu ích cho các nhiệm vụ cụ thể rất khác với việc có một trí thông minh chung áp dụng các bài học kinh nghiệm và các kỹ năng cần thiết cho một nhiệm vụ phức tạp hơn nhiệm vụ, hoặc nhiệm vụ hoàn toàn khác nhau. Nỗi sợ máy tính của chúng tôi không phải là một nỗi ám ảnh vô hại. Nếu chúng ta nghĩ rằng máy tính thông minh hơn chúng ta, chúng ta có thể bị cám dỗ để chúng làm suy nghĩ của chúng ta cho chúng ta với những hậu quả tai hại tiềm tàng.
Tội phạm học thuật toán sử dụng các mô hình hộp đen đang trở nên phổ biến trong việc xác định tại ngoại, xét xử sau khi kết án và các quyết định tạm tha sau khi kết án. Một nhà phát triển đã viết rằng, Cách tiếp cận là 'hộp đen', không có lời xin lỗi nào được thực hiện. Ông đưa ra một ví dụ đáng báo động: Rằng Nếu tôi có thể sử dụng vết đen hoặc cỡ giày hoặc kích cỡ của dây đeo trên cổ tay của họ, tôi sẽ. Các thuật toán hộp đen có xu hướng thiên về chủng tộc và không vượt trội so với các mô hình đơn giản chỉ xem xét độ tuổi và niềm tin trước đó.

Tra tấn dữ liệu . Trong một cuộc tìm kiếm không mệt mỏi cho các mối quan hệ có ý nghĩa thống kê, một số người đã cố gắng cắt và xé dữ liệu theo vô số cách. Theo những lời bất hủ của Ronald Coase, thì Nếu bạn tra tấn dữ liệu đủ lâu, nó sẽ thú nhận. Dữ liệu lớn và máy tính mạnh mẽ tạo điều kiện cho việc lạm dụng.
Một nhà nghiên cứu nổi tiếng đã khuyên một trợ lý đang phân tích dữ liệu được thu thập tại một bữa tiệc buffet Ý hoàn toàn có thể để tách thực khách thành nam, nữ, người ăn trưa, người ăn tối, người ngồi một mình, người ăn cùng 2, những người ăn theo nhóm 2+, những người gọi rượu, những người đặt hàng nước ngọt, những người ngồi gần tiệc buffet, những người ngồi xa, v.v., và sau đó nhìn vào những cách khác nhau trong đó những nhóm phụ này có thể khác nhau: những miếng pizza # miếng, # chuyến đi, mức độ đầy đĩa, họ có nhận được món tráng miệng, họ đã gọi đồ uống, v.v. Anh ta nói với trợ lý, làm việc chăm chỉ, vắt máu ra khỏi tảng đá này. Việc ép đá này đã dẫn đến bốn bài báo về pizza được xuất bản, với một bài báo nổi tiếng nhất rằng đàn ông ăn pizza nhiều hơn 93% khi họ dùng bữa với phụ nữ.

Đánh lừa chính mình . Nhà vật lý Richard Feynman đã đưa ra lời khuyên vượt thời gian này cho các nhà khoa học: Kiếm Hiệu trưởng đầu tiên là bạn không được tự lừa mình và bạn là người dễ bị lừa nhất. Các nhà khoa học thực sự chia sẻ lý thuyết của họ, đặt câu hỏi về các giả định của họ và tìm kiếm cơ hội để chạy các thí nghiệm sẽ xác minh hoặc mâu thuẫn với họ. Dữ liệu chú hề chỉ nhìn thấy những gì họ muốn xem.
Một nghiên cứu yêu cầu học sinh trung học dự đoán điểm số của họ trong bài kiểm tra toán. Điểm dự đoán trung bình cao hơn điểm thực tế trung bình, nhưng có mối tương quan 0,70 giữa điểm dự đoán và điểm thực tế. Tác giả đã rút ra hai kết luận. Đầu tiên là sinh viên đánh giá quá cao khả năng của họ. Tuy nhiên, có thể những sinh viên này đã đánh giá thấp độ khó của bài kiểm tra mà họ sẽ được đưa ra. Kết luận thứ hai của tác giả là điểm kiểm tra có thể tăng lên bằng cách nâng cao lòng tự trọng của học sinh. Tuy nhiên, mối tương quan tích cực giữa điểm số dự đoán và điểm thực tế có thể thay vào đó phản ánh thực tế rằng hầu hết các học sinh biết rõ họ đều giỏi toán và những học sinh thất bại biết rằng họ không biết rõ về tài liệu này. Họ không bi quan quá mức; họ đã thực tế.

Mối tương quan khó hiểu với quan hệ nhân quả . Cho dù có bao nhiêu lần chúng ta được nói rằng mối tương quan không phải là mối quan hệ nhân quả, nó có thể hấp dẫn không thể cưỡng lại để bỏ qua lời khuyên cần thiết này.
Năm 2011, Google đã tạo ra một chương trình trí tuệ nhân tạo có tên Google Flu, sử dụng các truy vấn tìm kiếm để dự đoán sự bùng phát dịch cúm. Họ khoe rằng, chúng tôi có thể ước tính chính xác mức độ hoạt động cúm hàng tuần hiện tại ở từng khu vực của Hoa Kỳ, với độ trễ báo cáo khoảng một ngày. Họ nói rằng mô hình của họ có độ chính xác 97,5%, trong đó mối tương quan giữa dự đoán của mô hình và số ca bệnh cúm thực tế là 0,975. Google đã làm điều đó như thế nào? Chương trình khai thác dữ liệu của Google đã xem xét 50 triệu truy vấn tìm kiếm và xác định 45 truy vấn có mối tương quan chặt chẽ nhất với tỷ lệ mắc bệnh cúm. Vì dịch cúm có tính thời vụ cao, Google Flu có thể chủ yếu là máy phát hiện mùa đông chọn thuật ngữ tìm kiếm theo mùa, như  Giáng sinh ,  kỳ nghỉ đôngvà  ngày lễ tình nhân . Khi nó vượt xa dữ liệu lịch sử phù hợp và bắt đầu đưa ra dự đoán thực tế, Google Flu kém chính xác hơn nhiều. Sau khi đưa ra báo cáo của mình, Google Flu đã đánh giá quá cao số ca mắc cúm trong 100 trong 108 tuần tiếp theo, trung bình gần 100%. Google Flu không còn đưa ra dự đoán về cúm.
Đang ngạc nhiên bởi hồi quy về phía trung bình . Khi dữ liệu dao động, các giá trị tương đối lớn đánh giá quá cao hiện tượng được đo; vì vậy các giá trị tiếp theo có xu hướng gần với trung bình hơn. Ví dụ, một người chơi gôn chiến thắng giải đấu golf Masters có thể sẽ không làm tốt trong giải đấu tiếp theo, không phải vì anh ta đã bị xáo trộn hoặc khả năng của anh ta bị xói mòn, nhưng vì chiến thắng là sự đánh giá quá cao khả năng của anh ta.
Dữ liệu cũng có thể hồi quy trở lên, giống như một loại chống jinx. Ví dụ, một công ty khoa học dữ liệu đã tiến hành các thử nghiệm so sánh bố cục hiện tại của trang web của khách hàng với tối đa 20 bố cục thay thế trên một triệu tên miền khác nhau. Khách hàng thỉnh thoảng phàn nàn về những tên miền kém hiệu quả mà họ cảm thấy nên kiếm được nhiều doanh thu quảng cáo hơn. Một nhà phân tích dữ liệu đã được đưa ra một danh sách các tên miền có doanh thu giảm trong ba tháng qua và được yêu cầu sửa lại các bố cục để xem liệu anh ta có thể tăng doanh thu hay không. Anh đã thành công, ngoạn mục như vậy. Sau khi anh ấy thay đổi, doanh thu chắc chắn đã tăng khoảng 20% ​​vào ngày hôm sau. Anh ấy đã nổi tiếng như một ngôi sao nhạc rock, nhưng một ngày anh ấy quá bận rộn để thực hiện bất kỳ thay đổi. Doanh thu tăng vọt như mọi khi, và bây giờ trò chơi đã tăng. Đó không phải là nhà phân tích.

Làm hại . Một thực tế đáng tiếc trong thời đại dữ liệu lớn là các doanh nghiệp và chính phủ giám sát chúng tôi không ngừng để họ có thể dự đoán hành động của chúng tôi và thao túng hành vi của chúng tôi. Các nhà khoa học dữ liệu tốt tiến hành thận trọng, tôn trọng quyền lợi và quyền riêng tư của chúng tôi. Quy tắc vàng áp dụng cho khoa học dữ liệu: đối xử với người khác như bạn muốn được đối xử.
Một trang web hẹn hò trên internet đã chạy ba thí nghiệm. Trong thí nghiệm 1, họ tạm thời xóa tất cả các hình ảnh khỏi trang web và thấy rằng có rất ít tin nhắn ban đầu, ủng hộ giả thuyết rằng tình yêu không mù quáng. Trong thí nghiệm 2, họ ngẫu nhiên giấu văn bản hồ sơ của mọi người và thấy rằng nó không ảnh hưởng đến xếp hạng tính cách, ủng hộ giả thuyết rằng tình yêu không thể đọc được. Thử nghiệm 3 đã đảo ngược xếp hạng tương thích, để các khách hàng được chọn ngẫu nhiên được thông báo rằng ai đó có khả năng tương thích cao với họ là một kết quả xấu và ngược lại. Hai thí nghiệm đầu tiên tương đối vô hại; thứ ba không quá nhiều. Công ty nên xem xét thực tế rằng khách hàng của họ chắc chắn không muốn cuộc sống của họ bị phá vỡ bởi sự không phù hợp lãng mạn. Một cuộc hẹn hò với một người không tương thích có thể là tuyệt vời;
Cần có tư duy phê phán để tránh những cạm bẫy này. Để đưa khoa học vào khoa học dữ liệu, chúng ta cần hành động ít giống máy móc hơn và giống các nhà khoa học hơn.
Gary Smith là giáo sư kinh tế Fletcher Jones tại Pomona College. Những sai lệch tiêu chuẩn của ông  : Những giả định thiếu sót, dữ liệu bị tra tấn và những cách khác để nói dối với thống kê  (Overlook / Duckworth, 2015) là một   cuốn sách của Tuần báo Luân Đôn và đưa ra một loạt các thực tiễn thống kê sai lầm và sai lệch. Cuốn sách mới nhất của ông là  9 cạm bẫy của khoa học dữ liệu (Nhà xuất bản Đại học Oxford, 2019.

Nhận xét

Bài đăng phổ biến từ blog này

CES 2020 có quy định về trang phục, đồ chơi tình dục và lập trình đa dạng hơn

Tầm nhìn của Facebook về kính đọc được suy nghĩ của bạn không chỉ là một giấc mơ

Đừng chia tay Facebook và Google dựa trên ba huyền thoại