Mục lục:

15 điều tuyệt vời mà mạng nơ-ron đã học để làm
15 điều tuyệt vời mà mạng nơ-ron đã học để làm
Anonim

Từ việc lái một chiếc xe hơi đến việc tạo ra những kiệt tác.

15 điều tuyệt vời mà mạng nơ-ron đã học để làm
15 điều tuyệt vời mà mạng nơ-ron đã học để làm

Mạng nơ-ron là một trí tuệ nhân tạo có khả năng tự học. Ở một số hình thức, các chương trình tương tự đã tồn tại công nghệ Máy tính thần kinh: lý thuyết và thực hành từ những năm 80, nhưng lĩnh vực này đã nhận được sự phát triển đặc biệt nhanh chóng vào khoảng năm 2015. Các trường đại học hàng đầu như Massachusetts và Oxford, cũng như các tập đoàn lớn, chẳng hạn như Google, bắt đầu tích cực khám phá các khả năng của mạng nơ-ron.

Bây giờ những công nghệ này có sẵn cho bất kỳ ai. Và nhân loại đã nghĩ ra hàng tá ứng dụng điên rồ và kỳ lạ nhất cho các chương trình như vậy. Dưới đây là một vài trong số họ.

1. Đến với khuôn mặt của những người không tồn tại

Mạng nơ-ron có thể phát minh ra khuôn mặt của những người không tồn tại
Mạng nơ-ron có thể phát minh ra khuôn mặt của những người không tồn tại

Những người bạn nhìn thấy trong hình trên trông có vẻ thực tế, nhưng họ không tồn tại. Hình ảnh của họ đã tạo ra sự phát triển không ngừng của các GAN để được cải thiện

mạng nơ-ron chất lượng, ổn định và biến thể từ NVIDIA. Chương trình được đào tạo về ảnh thật của những người nổi tiếng và kết quả là nó học được cách tạo ra những hình ảnh đáng tin cậy về khuôn mặt. Bạn có thể tự mình kiểm tra xem cô ấy làm tốt như thế nào.

2. Đọc to

Có nhiều công nghệ để tổng hợp giọng nói bằng cách sử dụng mạng nơ-ron. Đối với mục đích này, có các chương trình cho điều này, ví dụ, và "". Giọng nói được tạo theo cách này trôi chảy và chân thực, và có nhiều cách sử dụng cho phương pháp này, từ lồng tiếng cho các ứng dụng dành cho người khiếm thị đến tạo sách nói với chi phí thấp.

3. Lái ô tô

Nhiều công ty coi ô tô tự lái là tương lai của ngành giao thông vận tải. Audi, Uber, Google, Tesla, Yandex và nhiều tập đoàn khác đang có những bước phát triển riêng trong lĩnh vực này. Hầu như không có công nghệ nào trong số này hoàn thiện nếu không có mạng nơ-ron. Chúng giúp các phương tiện xác định vị trí của vạch kẻ, biển báo, các phương tiện khác và người đi bộ trên đường và đưa ra quyết định dựa trên dữ liệu này.

4. Khôi phục màu ảnh và video

Các nhà khoa học từ Đại học Waseda ở Tokyo đã phát triển Hãy để có màu sắc! một chương trình tạo ảnh và video đen trắng có màu. Mạng nơ ron đã học cách xác định các động cơ phổ biến trong hình ảnh (bầu trời thường có màu xanh lam, cây cối có màu xanh lá cây, v.v.) và sơn các vật thể bằng màu sắc thích hợp.

5. Nhìn thấy mặt chó ở khắp mọi nơi

Một trong những công nghệ mạng nơ-ron đầu tiên có sẵn cho nhiều đối tượng là Chủ nghĩa thiểu năng trí tuệ của Google vào năm 2015. Cô đã xử lý các hình ảnh, thêm bóng mặt chó, chùa và mái vòm vào chúng. Cư dân mạng bắt đầu truyền tay nhau những bức ảnh, bức tranh, video và bộ phim nổi tiếng của họ thông qua chương trình - nó trở nên bất thường và rùng rợn.

6. Viết nhạc

Bất kỳ loại thông tin kỹ thuật số nào cũng có thể được tải vào mạng nơ-ron, bao gồm cả âm nhạc. Một số nhà nghiên cứu đào tạo chương trình của họ về giai điệu của các nhà soạn nhạc nổi tiếng. Máy tính chưa tạo ra được những sáng tác có ý nghĩa, nhưng chúng sao chép khá tốt phong cách của các nhạc sĩ.

7. Khiến các chính trị gia phải nói bất cứ điều gì

Một trong những cách sử dụng đáng sợ nhất của mạng nơ-ron là tổng hợp video, đặc biệt là với các nhân vật của công chúng. Ví dụ, các nhà khoa học tại Đại học Washington đã phát triển Synthesizing Obama: Learning Lip Sync từ âm thanh, một chương trình tạo ra chuyển động môi của Barack Obama dựa trên bản ghi âm và thay thế chúng trong video. Hóa ra rất đáng tin cậy.

8. Đi bộ

Công ty con DeepMind của Google đã tiến hành một cuộc thử nghiệm. Ba nhân vật ảo khác nhau - một hình người, một cây gậy có hai chân và một quả bóng có bốn chân - đã phải học cách đi bộ. Họ không có thông tin về cách thực hiện điều này - chỉ có nhiệm vụ đi từ điểm này đến điểm khác và các cảm biến giúp xác định vị trí của chúng trong không gian. Sau hàng trăm giờ luyện tập, cả ba hình tượng đã học cách đi, chạy, nhảy và di chuyển trên các bề mặt không bằng phẳng.

9. Điều khiển rô bốt

Các công nghệ dựa trên mạng nơ-ron được sử dụng rộng rãi trong lĩnh vực chế tạo người máy. Ví dụ, một robot do Viện nghiên cứu Disney tạo ra có thể di chuyển về phía trước bằng một, hai và ba chân. Và robot giao hàng từ Starship Technologies là điều hướng trên đường phố, tránh chướng ngại vật và người đi bộ.

10. Nhận biết gian lận và tham nhũng

Một trong những chức năng chính của mạng nơ-ron là nhận dạng mẫu, bao gồm các mối tương quan giữa các sự kiện. Điều này rất hữu ích trong lĩnh vực tài chính: bạn có thể dự đoán hoạt động bất hợp pháp trước khi nó xảy ra. Ví dụ, ở Tây Ban Nha, các nhà khoa học đã tạo ra Dự báo Tham nhũng Công bằng Mạng Thần kinh: Phân tích các Tỉnh của Tây Ban Nha, một chương trình giúp phát hiện tham nhũng ở các tỉnh của đất nước. Và một số ngân hàng đang phát triển Citi Ventures triển khai Học máy và Trí tuệ Nhân tạo Với Con người và đang sử dụng các hệ thống nhận diện gian lận thẻ tín dụng.

11. Dịch văn bản trên hình ảnh trong thời gian thực

Mạng nơ-ron có thể dịch văn bản trên hình ảnh trong thời gian thực
Mạng nơ-ron có thể dịch văn bản trên hình ảnh trong thời gian thực

Tính năng dịch văn bản theo thời gian thực đã xuất hiện trong Google Dịch từ rất lâu, nhưng ít người biết rằng nó sử dụng Cách Google Dịch ép học sâu vào mạng nơ-ron của điện thoại. Với sự trợ giúp của họ, chương trình nhận dạng các chữ cái và các ký hiệu khác trong hình ảnh, ngay cả khi chúng bị mờ, xoay quanh trục, cách điệu hoặc bị bóp méo. Sau đó, ứng dụng đặt chúng thành các từ và câu, dịch và chiếu chúng lên hình ảnh. Và tất cả điều này chỉ trong tích tắc.

12. Chuyển phong cách nghệ thuật từ hình ảnh này sang hình ảnh khác

Mạng nơ-ron có thể chuyển phong cách nghệ thuật từ hình ảnh này sang hình ảnh khác
Mạng nơ-ron có thể chuyển phong cách nghệ thuật từ hình ảnh này sang hình ảnh khác

Vào năm 2016, một số công ty đã trình làng các công nghệ xử lý hình ảnh theo các phong cách nghệ thuật khác nhau. Các ứng dụng như Prisma, DeepArt và Ostagram đã xuất hiện. Prisma cho phép bạn chọn trong số hàng trăm bộ lọc được tạo sẵn, Ostagram và DeepArt - bạn có thể tự tải lên một bức tranh hoặc ảnh để tạo kiểu.

13. Biến những bản phác thảo thô ráp thành những bức tranh thực tế

Vào đầu năm 2019, NVIDIA đã trình chiếu Stroke of Genius: GauGAN Turns Doodles into Stunning, một chương trình Photorealistic Landscapes giúp biến những bức ảnh từ một vài hình dạng đơn giản thành những bức ảnh chi tiết tuyệt đẹp. Người dùng tạo một vài nét và mạng lưới thần kinh tạo ra một hình ảnh từ đó, từ xa không thể phân biệt được với bức tranh thực của một họa sĩ phong cảnh nào đó. Biển, đá, thành phố, rừng, mây - hàng chục đối tượng khác nhau có thể được thêm vào hình ảnh. Mạng nơ-ron thậm chí tự nó xác định nơi cần đổ bóng hoặc phản xạ.

14. Đọc môi

Các nhà khoa học tại Google và Đại học Oxford đã tạo ra công nghệ LipNet LipNet, sử dụng mạng lưới thần kinh để đọc môi. Và cô ấy làm điều đó chính xác hơn nhiều so với một người. Trung bình, những người khiếm thính đọc môi với độ chính xác 52% và LipNet với độ chính xác 88%.

15. Viết văn bản

Mọi người đã dạy mạng nơ-ron và cách làm việc với văn bản. Các chương trình được viết bởi Deep-speare: Một mô hình thần kinh chung của ngôn ngữ thơ, các bài thơ về Mét và Vần, truyện ngắn, văn bản giả cho Wikipedia, kịch bản cho các loạt bài (ví dụ: cho Bạn bè).

Và vào năm 2016, bộ phim ngắn Sunspring đầu tiên trên thế giới đã được phát hành, kịch bản được viết bởi trí tuệ nhân tạo. Rạp chiếu phim hoàn toàn vô nghĩa: máy tính vẫn đang vật lộn để tạo ra. Nhưng ai biết được, có thể sau vài năm nữa nghề biên kịch sẽ giảm xuống chỉ còn là biên tập các tác phẩm do máy tạo ra.

Đề xuất: