ISSO PODE SER ÉPICO
A rede neural DeepMind do Google demonstrou que pode criar vídeos curtos a partir de um único quadro de imagem, e é muito legal ver como isso funciona.
Como a DeepMind observou no Twitter , o modelo de inteligência artificial, chamado "Transframer" - é um riff de "transformer", um tipo comum de ferramenta de IA que cria texto com base em prompts parciais - "excelente em previsão de vídeo e síntese de visualização". e é capaz de "gerar vídeos de 30 [segundos] a partir de uma única imagem".
Jogo de adivinhação
Como observa o site da Transframer , a IA faz seus vídeos de perspectiva prevendo os arredores das imagens de destino com "imagens de contexto" - em suma, adivinhando corretamente como seria uma das cadeiras abaixo de diferentes perspectivas com base em extensos dados de treinamento que permitem ele "imagina" um objeto real de outro ângulo.
Este modelo é especialmente impressionante porque parece ser capaz de aplicar percepção de profundidade artificial e perspectiva para gerar a aparência da imagem se alguém se "mover" em torno dela, aumentando a possibilidade de videogames inteiros baseados em tecnologia de aprendizado de máquina em vez de renderização tradicional.
Mais comida para reflexão: um usuário do Twitter já disse que planeja usar o Transframer em conjunto com as saídas do algoritmo de geração de imagem DALL-E da OpenAI - um exemplo muito legal do tipo de ação AI-on-AI que provavelmente veremos muito mais nos próximos anos.
Comments