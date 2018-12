Gigantes da tradução, como Google e Microsoft, estão diante de um concorrente poderoso, apesar de pequeno. A startup alemãDeepL, baseada na cidade de Colônia, foi fundada por um ex-funcionário da Google.

A pequena empresa oferece uma ferramenta de tradução que produz textos estruturados de forma bem mais natural do que qualquer um de seus grandes competidores. O serviço utiliza a chamada tecnologia deep learning (aprendizado profundo), baseada em redes neurais artificiais.

Antes de lançar o novo mecanismo de tradução, em agosto de 2017, a empresa já atuava no "setor linguístico" há bastante tempo. Em 2009, os fundadores criaram um dicionário chamado Linguee. Além de várias opções de tradução, este oferece amostras de trechos de textos já traduzidos nos pares de línguas selecionados pelos usuários (alemão e português, por exemplo).

O Linguee coleta essas amostras de textos da internet, usando bots especiais. Esses robôs digitais, conhecidos como web crawlers (rastreadores da rede, em tradução livre), ajudam a indexar o conteúdo disponível na internet. Muitos trechos de textos vêm de documentos de instituições internacionais, como a União Europeia (UE).

Em seguida, um algoritmo de machine learning (aprendizado de máquina) processa a estrutura e o significado do texto coletado e aprende como certas ideias são expressadas em outra língua. Além disso, os usuários podem deixar comentários e classificar manualmente as traduções.

Ao longo de nove anos, o Linguee.com melhorou ao internalizar um número crescente de traduções de alta qualidade. Assim, tornou-se a base para uma nova ferramenta de tradução.

DeepL, abreviação de deep learning

O deep learning, ou aprendizado profundo, é um aspecto da inteligência artificial (AI, na sigla em inglês) que tem como objetivo replicar o aprendizado humano. No passado, programadores costumavam escrever comandos individuais para todas as tarefas que um computador tinha que cumprir. Agora, estão construindo uma rede de neurônios artificiais que pode ser treinada quando se mostra exemplos existentes ao computador.

Quanto mais exemplos, melhor o computador consegue aprender. O Big Data (análise e avaliação de grandes volumes de dados muito variados) ampliou ainda mais as oportunidades de machine learning.

Do ponto de vista tecnológico, o deep learning é um algoritmo que usa camadas múltiplas de processamento de informações. O termo Deep (profundo) faz referência ao número de camadas através das quais os dados são processados. A tecnologia – que opera automóveis autônomos, óculos de realidade virtual e softwares de reconhecimento facial – agora também ajuda com traduções.

Mais que apenas "aprendizado profundo"

A ferramenta DeepL não é a única que vem usando tecnologia de deep learning nos últimos dois anos. Gigantes da internet como Google, Microsoft e Yandex também usam esse instrumento. Então, o que torna a DeepL tão única?

Em primeiro lugar, o desempenho da rede neural tem como base a qualidade do material inserido usado para o treinamento. É aqui que o "irmão mais velho" da DeepL, o Linguee, entra em jogo, já que forneceu bilhões de exemplos de tradução de alta qualidade.

"Os dados do Linguee são material de treinamento de altíssima qualidade", afirma o porta-voz da empresa, Lee Turner Kodak.

Mas não foi apenas a qualidade dos dados que tornou a DeepL possível. "Nossos pesquisadores têm bons conhecimentos das últimas evoluções nessa área e construíram uma arquitetura de rede neural única", destaca Kodak.

Porém, é segredo como exatamente a tecnologia é composta – Kodak diz que não quer perder a vantagem de mercado da startup.

Para controlar a qualidade da tradução, a DeepL faz testes cegos com regularidade, para garantir que o programa mantenha seus altos padrões. A empresa reforça sua ambição de ser "a melhor máquina de tradução do mundo" com a publicação dos resultados de um teste cego, ou pesquisa qualitativa experimental, de agosto de 2017 em seu website. O teste comparou os resultados obtidos pela DeepL com os de ferramentas de tradução das empresas rivais Google, Microsoft e Facebook.

As ferramentas obtiveram cem frases que precisavam traduzir do inglês para alemão, francês e espanhol, e dessas três línguas para o inglês. Após a pesquisa, tradutores profissionais revisaram os textos produzidos e deram notas para as qualidades das versões. A DeepL foi escolhida com três vezes mais frequência que o Google Translate pelo fato de sua versão soar mais natural.

Tradução de e para o português

Nesta quarta-feira (05/12), a DeepL também lançou novos serviços de tradução, em português e russo. Com essas duas línguas, a startup agora oferece nove línguas europeias e 72 combinações de línguas no total.

O Google Translate conhece mais de cem línguas faladas no mundo inteiro. Mas a DeepL não pretende alcançar o concorrente tão cedo. Os fundadores da startup acreditam que a qualidade é mais importante que a quantidade.

"Queremos ter o melhor sistema de ferramentas de tradução disponível em cada língua. Então, em vez de lançarmos centenas de línguas apenas para as termos à disposição, treinamos nossas redes para entregar a mesma alta qualidade pela qual ficamos conhecidos", avalia Kodak.

No último domingo, a startup com sede em Colônia anunciou um novo investidor: a Benchmark Capital, do Vale do Silício. Com uma equipe de 25 funcionários, a DeepL agora planeja dobrar o investimento em pesquisa e desenvolvimento em um ano, afirma Kodak.

"Essa parceria não significa apenas dinheiro, mas conexões. Seremos capazes de aprender com a inteligência empresarial do investidor e com outras startups que já estão mais adiantadas no processo de desenvolvimento", explica o porta-voz.

