Tirando proveito do software de renderização gráfica dos videogames de futebol,
pesquisadores do MIT e do Instituto de Pesquisa de Computação do Qatar
desenvolveram um sistema que converte automaticamente vídeos 2-D para 3-D.

O vídeo convertido pode ser reproduzido em qualquer aparelho 3-D, seja uma TV,
sejam aparelhos especializados, como a plataforma Google Cardboard ou o Oculus
Rift.

3-D com engenharia reversa

Os videogames de futebol armazenam mapas 3D muito detalhados do ambiente virtual
que cada jogador está navegando a cada momento. Quando o jogador inicia um
movimento, o jogo ajusta o mapa e, em tempo real, gera uma projeção 2-D da cena
3-D que corresponde a um ângulo de visualização específico.

Os pesquisadores essencialmente rodaram esse processo no sentido inverso.

Eles colocaram o jogo FIFA13, da Microsoft, para rodar continuamente, e usaram a
ferramenta de análise de videogames PIX para armazenar as capturas de tela da
ação. A cada captura de tela, foi extraído também o mapa 3-D correspondente.

Usando um algoritmo padrão para detectar as diferenças entre duas imagens, eles
eliminaram a maior parte das capturas de tela, mantendo apenas aquelas que
melhor captavam os possíveis ângulos de visão e as configurações de cada
jogador. Ainda assim, o número total de capturas de tela fica na casa das
dezenas de milhares, que foram armazenadas em um banco de dados.

Partiu-se então para um jogo real de futebol. Para cada quadro do vídeo 2-D
sendo capturado, o sistema procura as 10 capturas de tela no banco de dados que
melhor correspondem a ele. Em seguida, o sistema decompõe todas essas imagens,
procurando as melhores equivalências entre as diversas regiões da imagem do jogo
e das capturas de tela do videogame. Quando são encontradas equivalências, o
programa sobrepõe a informação de profundidade das capturas de tela nas seções
correspondentes do quadro do vídeo. Por fim, todos os pedaços são reunidos e o
filme remontado.

Convincente, com retardo

O resultado é um efeito 3-D muito convincente. Em uma pesquisa entre
voluntários, a maioria dos torcedores deu ao efeito 3-D uma classificação de 5
(“excelente”) em uma escala de cinco pontos – a média ficou um pouco acima dos
4,5.

Segundo os pesquisadores, o sistema leva cerca de um terço de segundo para
processar cada quadro do vídeo da partida de futebol capturada ao vivo. Mas
quadros sucessivos poderiam ser processados em paralelo em um sistema
profissional, de modo que esse retardo só ocorreria uma vez.

Ainda que afirme estar trabalhando para reduzir o retardo, a equipe afirma que
um atraso na transmissão de um ou dois segundos proporcionaria uma margem de
segurança suficiente para permitir a conversão da transmissão das partidas de
futebol ao vivo de 2-D para 3-D.

O sistema é baseado em uma engenharia reversa dos videogames de futebol.

[Imagem: Christine Daniloff/MIT]

Fonte:inovacaotecnologica