Phân tích video kết hợp: bộ não và máy móc làm gì với khuôn mặt của chúng ta

Phân tích video kết hợp: bộ não và máy móc làm gì với khuôn mặt của chúng ta

Khả năng nhìn và nhận diện nhanh khuôn mặt là một siêu năng lực. Không cần lãng phí thời gian vào việc phân tích, nghiên cứu các nếp nhăn, nếp gấp và hình bầu dục. Nhận dạng khuôn mặt là ngay lập tức và dễ dàng. Nó dễ đến mức chúng ta không nhận ra mình làm điều đó như thế nào.

Hãy nghĩ xem các khuôn mặt khác nhau giống nhau như thế nào - hai mắt, miệng, mũi, tai nhô ra hai bên, mỗi lần theo cùng một thứ tự (thường xuyên nhất). Thật không thể tin được là chúng ta có thể phân tích một vật thể một cách dễ dàng như vậy.

Chúng ta được “lập trình” để nhận diện khuôn mặt từ khi sinh ra, nhưng giờ đây con người đã làm tốt hơn - họ đã dạy cho máy kỹ năng này. Việc áp dụng rộng rãi các hệ thống nhận dạng và nhận dạng con người sẽ ảnh hưởng như thế nào đến đời sống xã hội?

Pareidolia: tìm kiếm khuôn mặt tự động

Phân tích video kết hợp: bộ não và máy móc làm gì với khuôn mặt của chúng ta

Những người ở chế độ “tự động” có thể phân biệt được những hình ảnh quen thuộc trên bất kỳ bề mặt nào. Chỉ có ba yếu tố kiến ​​trúc của tòa nhà được coi là khuôn mặt của một con vịt đang ngạc nhiên. Đây là một ví dụ về pareidolia.

Từ pareidolia xuất phát từ các từ Hy Lạp para (para - gần, về, sai lệch so với một cái gì đó) và eidolon - hình ảnh. Đây là tên của ảo ảnh quang học, nhận thức về một hình ảnh hoặc ý nghĩa mà thực tế không có. Ví dụ: khuôn mặt trên thân cây hoặc hình động vật trên mây là pareidolia.

Phân tích video kết hợp: bộ não và máy móc làm gì với khuôn mặt của chúng ta
Bạn có thể tìm thấy nhiều bức ảnh như thế này tại thingswithfaces.com

Chúng ta nhìn thấy khuôn mặt của con người và khuôn mặt của động vật trong bất kỳ hình hình học. Toàn bộ nền văn hóa biểu tượng cảm xúc được xây dựng dựa trên nguyên tắc này. 🙂

Phân tích video kết hợp: bộ não và máy móc làm gì với khuôn mặt của chúng ta

Hiện tượng pareidolia có thể dễ dàng được dịch sang ngôn ngữ thuật toán. nghệ sĩ Shinseungback Kimyonghun chụp ảnh những đám mây hòa vào khuôn mặt người trong giây lát bằng cách sử dụng tập lệnh với thư viện OpenCV.

Ảo tưởng Thatcher: Lỗi sinh học mang tính hệ thống

Phân tích video kết hợp: bộ não và máy móc làm gì với khuôn mặt của chúng ta

Có một lỗi sinh học cho thấy Tầm quan trọng lớn hơn của kỹ năng nhận biết. Hầu hết các đồ vật xung quanh bạn - một cái ghế, một cái bàn, một chiếc máy tính - đều dễ nhìn và nhận biết chính xác từ mọi góc độ. Chỉ là không phải khuôn mặt.

Khuôn mặt lộn ngược tạo ra một trục trặc trong não gọi là hiệu ứng Thatcher (ảo ảnh). Hiện tượng này mô tả tình trạng khó phát hiện những thay đổi cục bộ trong một bức ảnh chân dung lộn ngược.

Chúng ta hãy lật bức ảnh của Margaret Thatcher lại và xem kết quả.Phân tích video kết hợp: bộ não và máy móc làm gì với khuôn mặt của chúng ta

Bức ảnh đầu tiên nhìn có vẻ bình thường nhưng nếu lật lại, vị trí mắt và miệng không chính xác sẽ ngay lập tức lọt vào mắt bạn. Con người và mạng lưới thần kinh nhân tạo cảm nhận hình ảnh khác nhau. Thật ngạc nhiên là “mạng lưới thần kinh” giữa hai tai chúng ta lại dễ bị đánh lừa đến vậy.

Ảo ảnh Thatcher minh họa một số cơ chế cơ bản giúp não chúng ta xử lý thông tin. Bộ não đọc một tập hợp các yếu tố riêng lẻ: một cặp mắt, mũi, miệng và tai. Ngoài các đặc điểm riêng của các đặc điểm trên khuôn mặt, mối quan hệ của chúng với nhau và vị trí cũng được tính đến. Đó là, khuôn mặt được coi là một hệ thống không thể thiếu.

Vì vậy, khi chúng ta nhìn thấy một khuôn mặt lộn ngược, não sẽ khó đánh giá tổng thể hình ảnh hơn - thông tin được “thu thập” riêng cho từng yếu tố: mắt ở đúng vị trí, miệng giống như miệng. Tuy nhiên, ngay khi chúng ta nhìn thấy khuôn mặt chính xác, nhận thức về một hệ thống duy nhất đột nhiên kết nối lại và các vấn đề bắt đầu xảy ra: rõ ràng là các đặc điểm thông thường được kết nối với nhau theo một cách bất thường.

Tại sao nó lại quan trọng? Bộ não con người có thể nhận ra những khác biệt nhỏ nhất trên các đặc điểm trên khuôn mặt nhờ tính toàn vẹn của nhận thức. Một vùng vỏ não nhận biết khuôn mặt và xác định hướng nhìn, hạch hạnh nhân và thùy não phân tích nét mặt, còn một vùng ở vùng trước trán của thùy trán và hệ thống khoái cảm của não đánh giá vẻ đẹp của nó.

Lỗi về tính năng: Khuôn mặt của Chernov

Phân tích video kết hợp: bộ não và máy móc làm gì với khuôn mặt của chúng ta
(с)

Đặc điểm nhận thức của con người được sử dụng để phân tích dữ liệu đa chiều tổng hợp bằng cách sử dụng “khuôn mặt”. Nhà toán học người Mỹ Herman Chernov vào năm 1973 đã phác thảo khái niệm sử dụng “khuôn mặt” để xác định sự phụ thuộc đặc trưng và khám phá mối quan hệ phức tạp giữa một số biến số.

Dữ liệu của Chernov được phản ánh dưới dạng chữ tượng hình trên khuôn mặt, trong đó giá trị tương đối của các biến đã chọn được trình bày dưới dạng hình dạng và kích thước của các đặc điểm riêng lẻ: chiều dài mũi, góc giữa lông mày, chiều rộng khuôn mặt - tổng cộng có tới 36 biến. Do đó, người quan sát có thể xác định các đặc điểm trực quan của các đối tượng duy nhất cho từng cấu hình giá trị.

Nhìn lướt qua sơ đồ gồm các khuôn mặt sẽ cho phép bạn nhanh chóng xác định xem các đặc điểm của các mặt cắt có khác biệt đáng kể (trùng hợp) hay không. Với việc xem xét chi tiết các đặc điểm trên khuôn mặt, sẽ thấy rõ đặc điểm nào (mỗi đặc điểm trên khuôn mặt là một đặc điểm riêng biệt của tập dữ liệu gốc) là giống và đặc điểm nào khác. Ví dụ, trong hình minh họa trên, bạn có thể dễ dàng nhận thấy sự khác biệt giữa các quốc gia qua các biểu tượng cảm xúc buồn và vui.

Tại sao một chiếc xe hơi cần khuôn mặt của bạn?

Phân tích video kết hợp: bộ não và máy móc làm gì với khuôn mặt của chúng ta

Kỹ năng nhận diện khuôn mặt nhanh chóng giúp bạn đón con từ mẫu giáo, chọn bạn đời, thể hiện cảm xúc một cách chính xác và phù hợp. Nhưng điều gì sẽ xảy ra khi một người chuyển khả năng này sang mạng lưới thần kinh nhân tạo?

Ý tưởng này có thể gây phản cảm. Không phải ai cũng sẵn sàng dễ dàng chấp nhận công nghệ lưu trữ dữ liệu, theo dõi chuyển động, phân tích hoạt động mua hàng và cảm xúc. Việc chuyển đổi từ giám sát video đơn giản sang phân tích video được cá nhân hóa đòi hỏi trách nhiệm phải tăng lên đáng kể.

Phân tích video kết hợp: bộ não và máy móc làm gì với khuôn mặt của chúng ta

Ngày nay các thuật toán như mặt sâu phát hiện những điểm tương đồng trên khuôn mặt với độ chính xác cao hơn con người. Thuật toán của Nvidia tạo ra khuôn mặt của những người không tồn tại chỉ trong vài giây. Các khuôn mặt trong ảnh ghép ở trên được tạo ra Mạng thần kinh StyleGAN, được đào tạo trên bộ dữ liệu gồm 70 hình ảnh. Chúng trông thực tế một cách đáng sợ.

Phân tích video kết hợp: bộ não và máy móc làm gì với khuôn mặt của chúng ta
Trình diễn thuật toán SearchFace

Lúc đầu, thuật toán nhận dạng khuôn mặt của Facebook khiến người dùng tăng cường cảnh giác, nhưng sau đó mọi người đều quen dần (hoặc rời khỏi mạng xã hội). Dịch vụ FindFace để tìm kiếm người bằng ảnh trên VKontakte đã nhận được nhiều phản hồi trái chiều và được sử dụng để bắt nạt, nhưng việc đóng cửa một dự án SearchFace tương tự đã gây ra phản ứng tiêu cực từ người dùng - suy cho cùng, nếu có dữ liệu thì hãy để nó được mở tới mọi người.

Các chuỗi bán lẻ đang lắp đặt công nghệ nhận dạng khuôn mặt để chống trộm, thu thập dữ liệu về độ tuổi, giới tính và thậm chí cả cảm xúc của khách hàng. Vào cuối ngày, mục tiêu là cải thiện trải nghiệm của khách hàng và kiếm tiền từ nó. Khi khách hàng nhận ra rằng hệ thống này mang lại lợi ích cho cá nhân họ, nhiều người sẽ đồng ý triển khai các công nghệ mới.

Với các trường hợp “đánh cắp danh tính”—gian lận thẻ tín dụng và danh tính—ngày càng gia tăng, người tiêu dùng sẽ thích một hệ thống có sẵn khi họ cần. xác định chúng một cách chính xác.

Hiện tại, các thuật toán giúp giải quyết các vấn đề về khung hình thiếu sáng, độ phân giải thấp và khả năng ngụy trang như kính, tóc giả và râu nhiều ngày. Hệ thống hoạt động với tốc độ đáng kinh ngạc và khớp khuôn mặt với cơ sở dữ liệu của hàng triệu người chỉ trong một giây.

Một số cửa hàng ở Mỹ phục vụ Nghi phạm trộm cắp có quyền lựa chọn: cho phép mình được chụp ảnh hoặc chính thức bị buộc tội. Tên trộm giành được tự do cùng với lệnh cấm ghé thăm cửa hàng và ảnh của hắn chính thức được đưa vào cơ sở dữ liệu. Các tệp chứa hình ảnh của mọi người được mã hóa và chỉ chủ sở hữu hệ thống mới có thể truy cập được.

Ai thu lợi từ sự công nhận?

Chơi video

Hầu hết các cửa hàng đều đã lắp đặt camera quan sát. Đối với phân tích video, không cần cập nhật phần cứng - chỉ cần kết nối với dịch vụ đám mây. Và với dịch vụ phân tích video Ivideon, thực tế không có rào cản gia nhập. Chi phí giải pháp từ 1 rúp mỗi máy ảnh cho phép bất kỳ doanh nhân nào có quyền truy cập vào phần mềm.

Động cơ chính để các nhà bán lẻ sử dụng công nghệ nhận dạng khuôn mặt là để chống trộm. Dựa theo cho Theo Tổ chức Bán lẻ Quốc gia, chỉ riêng ở Mỹ, khoảng 1,33% tổng số hàng hóa trong năm 2017 bị mất do trộm cắp - thiệt hại không dưới 46,8 tỷ USD.

Công nghệ nhận dạng khuôn mặt giúp giảm hơn 30% tình trạng trộm cắp trong cửa hàng.

Thông thường mức độ thiệt hại bị ảnh hưởng bởi các yếu tố phụ: sơ suất của nhân viên, đào tạo dịch vụ bảo vệ kém, mong muốn tiết kiệm tiền. Những vấn đề này và những vấn đề khác phải được giải quyết bằng cách sử dụng máy ảnh và công nghệ đám mây.

Hệ thống nhận dạng khuôn mặt tạo điều kiện làm việc nhanh chóng với danh sách “đen”: nó so sánh ảnh của khách hàng với cơ sở dữ liệu về những khuôn mặt không đáng tin cậy và nếu trùng khớp sẽ gửi cảnh báo tương ứng đến nhân viên bảo vệ.

Phần mềm phân tích tăng cường đáng kể tính bảo mật của cửa hàng. Một tên trộm có kinh nghiệm có thể nhận thấy “điểm mù” của camera. Trong trường hợp này, người bảo vệ có thể sử dụng điện thoại của mình để chụp ảnh nghi phạm rồi kiểm tra xem người đó có trong cơ sở dữ liệu hay không.

Các thương hiệu đã sử dụng tiếp thị trên thiết bị di động trong một thời gian dài - gửi SMS, thông báo đẩy và hiển thị quảng cáo được nhắm mục tiêu. Đối với bán lẻ truyền thống, hệ thống nhận dạng mang lại cơ hội giống như những người bán hàng trực tuyến nhận được bằng cookie.

Nền tảng tương tự được sử dụng để xác định những kẻ trộm đồ đang giúp các nhà bán lẻ tìm ra mặt tiền cửa hàng nào thu hút người mua hàng tốt hơn. Hệ thống nhận dạng giúp nhận diện khách hàng VIP ngay tại lối vào cửa hàng. Sử dụng dữ liệu từ CRM, người bán có thể nhanh chóng đưa ra lời đề nghị có lợi cho khách hàng.

Phân tích video kết hợp: bộ não và máy móc làm gì với khuôn mặt của chúng ta
Tại Trung tâm tài chính quốc tế Seoul, camera ghi lại thông tin theo thời gian thực định nghĩa tuổi và giới tính của người đó và đưa ra quảng cáo theo các thông số đã xác định

Thông tin khách hàng kích hoạt một công cụ mạnh mẽ để tăng doanh số bán hàng và đánh giá nhu cầu của khán giả. Các camera sẽ giúp bạn tùy chỉnh việc hiển thị quảng cáo video cho một khách truy cập cụ thể tùy thuộc vào giới tính, độ tuổi và trạng thái cảm xúc của họ, đồng thời cũng sẽ trở thành nhà cung cấp dữ liệu để tính toán hiệu quả của quảng cáo.

Những cơ hội trên dành cho các nhà bán lẻ thường nghe như những tiếng ồn quảng cáo khó chịu. Các luận điểm về “tăng trưởng lợi nhuận” và “nhu cầu của khán giả” đi kèm với bất kỳ công cụ CNTT nào trên thị trường – từ ERP đến thẻ giá điện tử. Hệ thống nhận dạng khuôn mặt có nhiều thứ hơn là tiếp thị thuần túy về trí tuệ nhân tạo và công nghệ tương lai không? Hãy trả lời câu hỏi này thông qua các ví dụ về việc sử dụng hệ thống thực trong các cửa hàng hiện có.

“Làm việc tại hiện trường”: ai nhận diện được khuôn mặt trong điều kiện thực tế

Phân tích video kết hợp: bộ não và máy móc làm gì với khuôn mặt của chúng ta

7-Eleven là chuỗi bán lẻ lớn nhất thế giới, vận hành hơn 36 cửa hàng nhỏ tại 000 quốc gia dưới sự quản lý của Seven-Eleven Nhật Bản. Gần đây công ty thành lập phần mềm tại 11 cửa hàng của mình. Công nghệ nhận dạng khuôn mặt và phân tích hành vi trong mạng bán lẻ được sử dụng để xác định chủ thẻ khách hàng thân thiết, giám sát lưu lượng khách hàng và xác định mức độ tồn kho của hàng hóa trong kho.

Phân tích video kết hợp: bộ não và máy móc làm gì với khuôn mặt của chúng ta

Saks là chuỗi bán lẻ cao cấp có tuổi đời hàng thế kỷ, hiện thuộc sở hữu của một trong những công ty lâu đời nhất trên thế giới (thành lập năm 1670), Hudson's Bay Company. Phân tích video được sử dụng tại Saks chủ yếu là để chống trộm. Phần mềm kiểm tra ảnh của những người bị nghi ngờ là kẻ trộm trong cửa hàng dựa trên cơ sở dữ liệu về những kẻ trộm trong cửa hàng đã được biết đến. Các camera được nối mạng để có thể xem kết quả tại trụ sở của Saks ở New York.

Theo Guardian, các cửa hàng và khách sạn cao cấp ở châu Âu thường xuyên sử dụng công nghệ nhận dạng khuôn mặt để theo dõi các VIP và người nổi tiếng nhằm đảm bảo họ nhận được trải nghiệm tốt nhất có thể.

Phân tích video kết hợp: bộ não và máy móc làm gì với khuôn mặt của chúng ta

Tại Mỹ, chuỗi cửa hàng burger CaliBurger sử dụng công nghệ nhận dạng khuôn mặt trong chương trình khách hàng thân thiết. Ki-ốt tương tác “nhận dạng” khách hàng, ghi nhớ đơn đặt hàng và cung cấp các món ăn yêu thích cũng như chấp nhận thanh toán bằng nhận dạng khuôn mặt.

Hệ thống loại bỏ rào cản tham gia chương trình phần thưởng dành cho người cao tuổi có thể gặp khó khăn khi sử dụng ứng dụng di động, điểm thưởng và thẻ tín dụng.

Hệ thống nhận dạng khuôn mặt được sử dụng rộng rãi ở châu Á, đặc biệt là ở Trung Quốc, nơi chúng được sử dụng để thanh toán thực phẩm, rút ​​tiền từ máy ATM hoặc thậm chí vay tiền. Độ chính xác của nhận dạng khuôn mặt ở Trung Quốc vượt quá khả năng của mắt người. Điều này cũng là do sự chuyển đổi quy mô lớn của Trung Quốc từ nhận dạng 2D sang 3D.

Trong trường hợp đầu tiên, thuật toán sử dụng hình ảnh hai chiều được tích lũy trong cơ sở dữ liệu để phân tích. Nhận dạng 3D phân tích hình ảnh XNUMXD được tái tạo và cho thấy độ chính xác cao hơn nhiều. Ở Trung Quốc, quét khuôn mặt có thể được sử dụng để mua hàng (ví dụ: thanh toán đơn hàng tại KFC), thanh toán và vào các tòa nhà.

Phân tích video kết hợp: bộ não và máy móc làm gì với khuôn mặt của chúng ta

Đến Alipay cần phải mỉm cười, để hệ thống nhận dạng thanh toán hiểu: phía trước không phải là một bức ảnh mà là một người sống. Người ta khẳng định không thể lừa dối Alipay: việc thay đổi màu tóc, trang điểm hay sử dụng tóc giả đều không thay đổi được gì. Hệ thống sử dụng một tập hợp các tính năng đặc biệt có tính đến hình dạng của khuôn mặt và vị trí của các điểm nhất định trên đó.

Những phát hiện

Quy mô đầu tư trực tiếp của các công ty phương Tây và Trung Quốc vào công nghệ nhận dạng khuôn mặt là rất lớn. Tuy nhiên, ở Nga việc thực hiện các dự án như vậy chỉ là vấn đề thời gian. Các công ty thương mại lớn đã hiểu được lợi ích và tác động kinh tế. Nếu chúng ta coi nhận dạng khuôn mặt như một sản phẩm, điều quan trọng là phải hiểu rằng mỗi phân khúc kinh doanh đều có những đặc điểm riêng, bao gồm cả giá cả. Doanh nghiệp càng lớn thì càng cần nhiều camera và mô-đun phân tích. Giải pháp dành cho các doanh nghiệp lớn luôn là những dự án tùy chỉnh phức tạp và việc tùy chỉnh đòi hỏi phải có thêm kinh phí. Các doanh nghiệp vừa và nhỏ có thể dễ dàng thực hiện bằng một camera có mô-đun nhận dạng khuôn mặt được kết nối. Trong trường hợp này, chi phí của giải pháp tương đương với việc sử dụng giám sát video trên đám mây.

Nguồn: www.habr.com

Mua dịch vụ lưu trữ đáng tin cậy cho các trang web có bảo vệ DDoS, máy chủ VPS VDS 🔥 Mua dịch vụ hosting website đáng tin cậy với bảo vệ DDoS, máy chủ VPS VDS | ProHoster