A gigante Meta, apresentou 2 novas ferramentas, ainda em fase de investigação, capazes de gerar vídeo e imagem através de comandos de texto – o Emu Video e o Emu Edit.
Estes modelos de AI generativa visam facilitar a criação de imagens e vídeos.
Emu Video
Este modelo permite a criação de vídeos curtos, através de comandos de texto, em 2 passos.
Primeiro é “gerada” uma imagem através de um comando de texto, e depois, é gerado o vídeo baseado no texto e nas imagens. A ferramenta é capaz de criar vídeos curtos de 4 segundos, com uma resolução de 512×512, e também de animar imagens, com base nas instruções do utilizador.
Emu Edit
Segundo a Meta, a grande vantagem do Emu Edit, nos dias de hoje, é a capacidade que este modelo tem de seguir instruções precisas, dando um maior controlo aos utilizadores e evitando modificações excessivas.
O Emu Efit, foca-se em alterar apenas os píxeis relevantes que foram pedidos, executando as instruções de edição de forma precisa.
“Por exemplo, ao acrescentar o texto “Aloha!” a um boné de beisebol, o boné em si deve permanecer inalterado.”
AI Meta Blog, 16 de Novembro de 2023.
Fonte: AI Meta Blog