Mọi thứ về DALL-E: trình tạo văn bản thành hình ảnh AI

Moi thu ve DALL E trinh tao van ban thanh hinh
Bình chọn post

[ad_1]

Bạn đã từng nhìn thấy những hình ảnh vui nhộn với những dòng chữ kỳ lạ được viết bên cạnh chúng vào những tuần trước trên Twitter chưa? Nếu vậy, bạn có thể muốn biết rằng những hình ảnh này được tạo ra bởi một phần mềm AI: DALL-E 2 giúp biến lời nói của bạn thành một ngôn ngữ mới cụ thể và sau đó phát triển các hình ảnh thực tế từ đó. Khá hấp dẫn, phải không? Đây là tất cả những gì bạn cần biết về nó.

DALL-E là gì?

DALL-E là một phần mềm AI mới có thể biến lời nói của bạn thành hình ảnh và tác phẩm nghệ thuật. Người dùng có thể chỉ cần chèn một văn bản bằng tiếng Anh và mạng nơ-ron sẽ tạo ra một hình ảnh từ đó. Công cụ này được phát triển bởi OpenAI, một công ty khởi nghiệp được Microsoft hậu thuẫn và công nghệ Imagen của Google. Cho đến nay, mô tả của DALL-E trên trang web OpenAI nói rằng nó “một hệ thống AI mới có thể tạo ra hình ảnh và nghệ thuật thực tế từ mô tả bằng ngôn ngữ tự nhiên“, đó chính xác là những gì nó làm.

Bạn Đang Xem: Mọi thứ về DALL-E: trình tạo văn bản thành hình ảnh AI

Nó có thể tạo ra những bức tranh thậm chí là ngẫu hứng nhất: chẳng hạn như “Gấu bông đi mua hàng tạp hóa ở Ai Cập cổ đại”. Vào tháng 1 năm 2021, OpenAI đã giới thiệu DALL-E, một phiên bản cũ hơn của phần mềm. Giờ đây, đó là một hệ thống thông minh hơn và mới hơn – DALL-E 2.

© OpenAI

Các nhà phát triển của nó nói rằng “DALL-E 2 sẽ cho phép mọi người thể hiện bản thân một cách sáng tạo. DALL-E 2 cũng giúp chúng tôi hiểu cách các hệ thống AI tiên tiến nhìn và hiểu thế giới của chúng ta, điều này rất quan trọng đối với sứ mệnh của chúng tôi là tạo ra AI mang lại lợi ích cho nhân loại“.

DALL-E hoạt động như thế nào?

Công cụ DALL-E là một mạng nơ-ron được OpenAI đào tạo để tạo hình ảnh từ văn bản. Nó có thể kết hợp các khái niệm không liên quan và tạo ra các phiên bản được nhân hóa của động vật và đồ vật. DALL-E hoạt động cùng với CLIP, một hệ thống thị giác máy tính mà OpenAI đã giới thiệu vào năm ngoái. Mạng nơ-ron chuyển ngôn ngữ của con người sang ngôn ngữ của chính nó và chỉ sau đó biến chúng thành hình ảnh.

Xem Thêm : Cách tạo một cuộc trò chuyện nhóm trong Viber: Android, iPhone

Giannis Daras, một Tiến sĩ ứng cử viên khoa học máy tính, đã đăng ví dụ về thứ mà anh ấy gọi là “ngôn ngữ riêng của AI” trên Twitter:

Apoploe vesrreaitais có nghĩa là chim“, Daras viết trên Twitter.”Contarra ccetnxniams luryca tanniounons, “có nghĩa là bọ hoặc sâu bệnh”.

DALLE-2 có một ngôn ngữ bí mật. “Apoploe vesrreaitais” có nghĩa là chim. “Contarra ccetnxniams luryca tanniounons” có nghĩa là bọ hoặc sâu bọ. Lời nhắc: “Apoploe vesrreaitais eat Contarra ccetnxniams luryca tanniounons” đưa ra hình ảnh những con chim đang ăn bọ. Một chủ đề (1 / n) pic.twitter.com/VzWfsCFnZo

Giao diện của DALL-E rất đơn giản: có một hộp văn bản nơi người dùng có thể chèn văn bản, một nút để bắt đầu chuyển đổi và hình ảnh ngay bên dưới nó. Các nhà phát triển của nó giải thích cách DALL-E 2 làm: “Nó sử dụng một quá trình được gọi là “khuếch tán”, bắt đầu với một mẫu các chấm ngẫu nhiên và dần dần thay đổi mẫu đó đối với một hình ảnh khi nó nhận ra các khía cạnh cụ thể của hình ảnh đó“.

Hiện tại, phiên bản mới của DALL-E chỉ dành cho một nhóm nhỏ người để tránh mọi tuyên bố thù địch, ảnh khoả thân và không phù hợp có thể gây hại cho người dùng. Mặc dù vậy, bạn có thể tham gia danh sách chờ bằng cách giải thích lý do tại sao bạn muốn thử nghiệm chương trình và có thể các nhà phát triển sẽ cấp cho bạn quyền truy cập sớm.

Phần mềm sẽ sớm được thêm vào API để các nhà phát triển bên thứ ba có thể sử dụng. Trong thời gian chờ đợi, bạn có thể dùng thử phiên bản “thu nhỏ” của DALL-E: DALL-E Mini mà cũng tạo ra hình ảnh từ văn bản và là mã nguồn mở. Mặc dù, đôi khi nó bị kẹt do một số lượng lớn các yêu cầu.


[ad_2]
Máy tính vàng

Nguồn: https://maytinhvang.com
Danh mục: TIN HỌC

Bài viết liên quan

0903064855
chat-active-icon