|
Versão
para impressão A NOVA TORRE DE BABEL . Por
Sentada à sua escrivaninha em Manhattan, Guylaine Laperrière fala francês. As frases soam musicais aos ouvidos americanos. Cartões postais de Montreal fixados pelas paredes do escritório relembram o lugar onde os sons que está reproduzindo são ouvidos diariamente nas ruas. Guylaine Laperrière veio a Nova Iorque para estudar teatro de musicais. Um dia, um amigo perguntou se ela queria fazer dinheiro extra dublando em francês um curta promocional sobre seguros. Ela pegou o trabalho e se surpreendeu com o quanto se divertiu trazendo idéias de uma língua para outra. Ceinture baudrier, repete mansamente. Ceinture diagonale. Cinto de segurança, cinto de segurança. Laperrière é uma das mais de 12 mil tradutoras contratadas pela Berlitz, uma firma centenária especializada em ensino de línguas e a maior do mundo em traduções. Ela edita uma tradução do manual do proprietário do novo Chrysler PT Cruiser para o dialeto falado em Quebec. Como se pode esperar de uma indústria baseada na circulação de palavras, a revolução digital trouxe mudanças por ali. Em breve, Laperrière e seus colaboradores começarão a usar o sistema de memória chamado Trados. Esse sistema procura frases que já foram traduzidas em documentos anteriores. Assim, Laperrière não terá de comparar baudrier com diagonale toda vez que um Chrysler novo for lançado. Mesmo numa época em que telefonia via satélite e videoconferência internacional são coisas do cotidiano, essa é a forma pela qual muitos dos documentos mundiais migram de uma cultura para outra: por intermédio de tradutores como Laperrière, que trabalham exaustivamente a mão. Isso seria surpresa para qualquer um que levasse em consideração um artigo que apareceu em um jornal inglês de 50 anos atrás, anunciando uma novidade que já teria tirado a Berlitz do mapa: um aparelho eletrônico inventado na Universidade de Londres permitia a estudantes e secretárias compor e traduzir textos em uma dezena de línguas. "Tão rápido quanto um usuário pode digitar palavras, digamos, em francês, o equivalente em húngaro ou russo sairá gravado na fita", registra o News Chronicle. Seis anos depois, um cientista da Universidade de Michigan que também estava trabalhando com traduções por computador então chamada máquina de tradução, ou MT assegurou à Associação de Imprensa que, "dentro de uma geração, a máquina de tradução será fato consumado, assim como a máquina de leitura". Em 1960, outro pesquisador, Emile Delavenay, exultava com o fato de "a máquina de tradução estar na soleira de nossa porta". Esse imbatível otimismo aparece de novo na Business Week de 1998, em que se previa que, até o final do ano passado, a AT&T e o Advanced Telecommunication Research Institute do Japão já teriam o protótipo do sistema de telefone que traduziria automaticamente chamadas do "japonês para o inglês e vice-versa". O sonho da tradução perfeita, automática e em tempo real feita por computador tem sido a obsessão de mentes brilhantes da pesquisa computacional, da lingüística e de inteligência artificial. Essa expectativa orienta heróicos esforços de pesquisa e desenvolvimento em frentes acadêmicas e comerciais, da IBM ao Instituto Tecnológico de Massachussets (MIT), queimando bilhões de dólares na busca do que pode vir a ser a suprema concretização de uma sociedade global sem fronteiras. Mas isso ainda está longe de acontecer. Por um breve momento, imaginava-se que a internet seria uma marreta tecnológica perfeita para forçar americanismos goela abaixo de todos. O fato de o léxico da MTV ter sido a língua-mãe da primeira geração de webzines e salas de chat parecia assegurar o domínio do inglês como a língua franca global do século 21. Agora, todos trazem seus próprios dialetos para o festim on-line. A Slangsoft, recém-criada empresa israelense, está usando a linguagem Java para criar teclados que aceitem a digitação em 42 línguas, incluindo aquelas que não usam o alfabeto romano, como chinês, coreano, hindi, hebraico e sânscrito. As últimas versões do Netscape e do Internet Explorer tornaram mais fácil a elaboração de páginas para a internet, já que os textos podem correr da direita para a esquerda, o que é uma ótima notícia se você está criando páginas em hebraico ou árabe. Já parece antiquado receber um e-mail do escritório de Tóquio com a tela cheia de símbolos indecifráveis. Razoável que se espere por uma opção "salvar como em espanhol" quando se está trabalhando no editor de texto. A facilidade com que as palavras escorrem por entre redes e aplicativos traz a promessa de que a alta tecnologia eliminará o vírus que "confundiu" (conforme a tradução do Rei James para a Bíblia) todas as línguas da Terra. Enquanto isso, remamos contra essa enxurrada de textos incompreensíveis somente com a fé de que, no futuro próximo, a rede considerará diferenças lingüísticas um problema facilmente contornável. Se você quer um exemplo prático da evolução da máquina de tradução (MT), visite a Babel Fish. Batizado com o nome de uma criatura do livro de Douglas Adams, O Guia do Mochileiro das Galáxias, o programa que pode ser fisgado no endereço babelfish.altavista.com é praticamente a primeira exposição dos navegadores da rede à tradução computadorizada. Tem sido regra entre os artigos que versam sobre máquinas de tradução citar algumas passagens de, digamos, Hamlet, transpostas para várias línguas pela Babel Fish, para que fique demonstrada a tolice inerente à MT. Ou, como o próprio peixe da Babel Fish nos diz ao passar uma versão em inglês desse trecho para o português: "Tem se tornado rigueur nos artigos sobre a tradução de máquina citar, por exemplo, alguma passagem de Hamlet que mashed com diversas línguas pelos peixes de Babel para demonstrar o goofiness inerente da TA" . O cérebro de Babel Fish é um híbrido de inteligência humana e artificial um ícone cabível para a máquina de tradução, que nasceu em um momento de especulação do cruzamento das ciências da vida com uma nova geração de máquinas pensantes. O que Babel Fish e as lições de 50 anos de pesquisa em MT sugerem é que temos de mudar nossas idéias sobre qual pode ser o papel apropriado para os computadores no ato da tradução. Veja-se o caso da Fundação Rockefeller, criada em 1913 e uma das maiores fontes de inovações científicas do último século, englobando vasta gama de projetos, desde a construção do telescópio Hale em Mount Palomar até a pesquisa de novos métodos anticoncepcionais. O cientista Warren Weaver, que forjou o termo "biologia molecular" nos anos 30, direcionou os programas da fundação para as ciências naturais. Brilhante matemático conceitual que também estava fascinado pelas poéticas da linguagem, Weaver é co-autor de um dos marcos do pensamento da era da informação Mathematical Theory of Communication. Esse cientista foi um dos primeiros a se dar conta de que a geração recém-nascida dos gigantes metálicos poderia vir a ser mais que tolas calculadoras. Em 1947, Weaver escreveu uma carta para Norbert Wiener, da MIT, o tipo de pessoa que trilha caminhos alternativos e que estava aplicando o estudo de processos mecânicos aos sistemas vivos o que hoje chamamos de cibernética. Weaver propôs que a tradução pudesse ser considerada um problema criptográfico. A resposta de Wiener foi desencorajadora: "Eu francamente temo que as fronteiras entre as palavras de línguas diferentes sejam muito vagas e as conotações emocionais e internacionais sejam muito amplas para que se possa esperar por um esquema de tradução mecânica". Weaver não deixaria passar assim. Ele acreditava que as barreiras de compreensão entre culturas poderiam ir abaixo com a ajuda da máquina de tradução uma preocupação especialmente relevante sob a sombra crescente da bomba atômica. Em 15 de julho de 1949, Weaver datilografou um memorando e o mandou para 200 das mentes mais brilhantes de sua geração: "Preocupei-me com a provável ingenuidade das idéias aqui apresentadas, mas o assunto parece tão importante que desejei expor minha ignorância". O memorando começava com a história do código em turco que sugeriu a Weaver que computadores assim como o criptógrafo seriam capazes de uma tradução puramente matemática, sem que fosse necessário programá-los para que entendessem os significados das palavras. Mais adiante, antecipava com exatidão muitas das perplexidades que de fato viriam a amaldiçoar a MT durante o meio século que se seguiu, desde ambigüidade das palavras até o problema maior que era conseguir um computador com memória capaz de considerar o contexto de uma frase. Weaver sugere que a linguagem dos documentos científicos, com seus termos estritamente definidos, poderia servir-se da tradução automática. Ele estava certo: as aplicações mais confiáveis da MT se basearam na pré-edição ou restrição da linguagem a um texto-fonte que definia com antecedência os termos e limitava os domínios do discurso. Uma das referências mais significativas do memorando é a parte em que pondera sobre a possibilidade de um sistema de símbolos pré-lingüístico estar por trás de todas as linguagens humanas. Se tal sistema fosse descoberto ou criado, especulava Weaver, poderia ser usado como meio de se converter idéias de um idioma para outro. Traduzindo as palavras no texto original para esse código e de volta para o idioma desejado, o código poderia ser utilizado como interface universal entre as línguas. (Essa é uma idéia mais antiga do que o próprio computador. Em 1629, René Descartes sugeriu a invenção de um código que determinasse o mesmo número para conceitos equivalentes em diversas línguas. Isso, esperava ele, tornaria possível a construção de um dicionário universal. John Wilkins, o primeiro-secretário da Royal Society de Londres, propôs uma nova "língua filosófica" que dividiria todas as coisas concebíveis do universo em 40 categorias, cada uma das quais teria recebido um nome logicamente derivado. Essa noção criaria uma segunda língua global que seria compreensível por qualquer nação. Tal interface universal chegou a ser conhecida como interlíngua.) O memorando de Weaver funcionou como semente jogada dentro de uma solução de idéias sobre computação, teoria da comunicação e lingüística. Em dois anos, programas de máquinas de tradução foram lançados no MIT, na Universidade da Califórnia, na Secretaria Nacional de Normas Técnicas, na Universidade de Washington e na Corporação Rand. Nem todos estavam preparados para a idéia de máquinas digitais trabalharem com qualquer outra coisa que não dígitos. Profissionais da lingüística alegaram que as idéias de Weaver eram ingênuas. Mas o princípio básico proliferou: referências à MT começaram a aparecer em livros-texto e publicações acadêmicas. Em janeiro de 1954, uma equipe da Universidade de Georgetown sediou uma demonstração pública da MT no Escritório Técnico de Computação da IBM, em Nova Iorque. A tradução apresentada foi do russo para o inglês. Foi um sucesso, amplamente divulgado. Em 1956, a pesquisa de MT pegou fogo no mundo todo. Até o final de 1962, China, México, Bélgica, Iugoslávia, Hungria, Alemanha Ocidental e França já tinham entrado na corrida pela máquina de tradução. Nos Estados Unidos, o Departamento de Defesa, a Força Aérea, a Fundação Nacional de Ciência e a CIA decidiram abrir o cofre para os chefes de pesquisas que demonstravam interesse em MTs muitos dos quais vinham trabalhando com afinco em projetos acadêmicos cronicamente malsubsidiados. Como na corrida espacial, algumas das melhores coisas que vieram das pesquisas de MT tinham pouco a ver com seu objetivo em si. Detonou-se aí uma explosão de interesse em lingüística formal. Trabalhos importantes sobre inteligência artificial e reconhecimento ótico de caracteres foram feitos para resolver problemas da MT. Mas qual era mesmo o objetivo primeiro? Alguns pesquisadores alegavam, com a mania dos anos 50 por acrônimos, que seus objetivos eram TTAAQ tradução totalmente automática de alta qualidade. É mais ou menos a versão texto a texto daquele tradutor universal de Jornada nas Estrelas. Um telefone tradutor seria de fato TTAAQ, mas nenhum intérprete, para os quais se acrescentavam as exigências de reconhecimento e sintetização precisos da voz, tinha o mesmo entusiasmo original pela MT. Havia um pequeno segredo sobre a MT: os programas, quando funcionavam, não geravam traduções lá muito compreensíveis. Na melhor das hipóteses, a produção da MT era truncada como esta tradução, do chinês para o português, feita pelo drive fotoscópico de US$ 1 milhão da IBM: "Mísseis guiados modernos já possível carregar com cabeças de bombas de hidrogênio e bombas atômicas de guerra. Portanto, trata-se de uma arma de grande poder de destruição". Profissionais contratados para "suavizar" textos traduzidos reclamam que a MT altera os significados dos textos muito mais que qualquer tradutor humano despreparado seria capaz de fazer. Um leitor pode interpretar palavras e expressões de maneira errada, mas normalmente tem uma idéia do parágrafo ao compreender genericamente suas referências. Esse processo de compreensão por meio do contexto não faz parte de nenhum computador no presente estágio de desenvolvimento da MT. Enquanto o dinheiro de Washington continuava rolando, alguns daqueles que apoiavam a MT começaram a se distanciar. Especialistas reconheciam que havia projetos de pesquisa de MTs em andamento que não tinham TTAAQ (tradução totalmente automática de alta qualidade) como seu foco principal. Mesmo traduções de baixa qualidade poderiam ser úteis na extração do significado de montanhas de documentos. A maré da opinião pública, entretanto, estava se voltando contra a MT, que já tinha produzido tantos avanços, mas tão poucos resultados visíveis. Na imprensa, a MT passou de a bola da vez para o mote de piadas populares. A mais infame falha da MT, citada até hoje em artigos sobre o assunto, envolve um computador que supostamente traduz a frase do inglês the spirit is willing, but the flesh is weak (o espírito tem boa vontade, mas a carne é fraca; Mateus, 26:41) para o russo: "A vodca é boa, mas o bife está ruim". (Spirit, em inglês, significa tanto alma, espírito, quanto bebida alcoólica.) O cataclisma se deu em 1966. Para avaliar o progresso da MT para as agências federais, em 1964, a Academia Nacional de Ciências instalou o Comitê de Acompanhamento do Processamento Automático da Linguagem (Alpac). Quando o comitê publicou seus relatórios, dois anos depois, foi devastador: "Não há possibilidade imediata ou previsível da utilização de máquina de tradução", sentenciou. O relatório detonou com o projeto Georgetown, que requisitava pós-edição humana. Afirmou que o governo dos Estados Unidos já tinha uma grande reserva de tradutores malpagos, fulminou com um potencial "excesso de tradução" e recomendou que todos os fundos para a pesquisa de MT fossem cortados imediatamente. Os efeitos do relatório ficaram conhecidos como o "inverno da MT". Em 1963, dez grupos de pesquisa prosperavam nos Estados Unidos. Dois anos depois de o relatório ter sido publicado, os três grupos remanescentes lutavam desesperadamente por fundos. A frente fria chegou ao outro lado do oceano, congelando a pesquisa no Reino Unido, no Japão e até na União Soviética. Acadêmicos debandavam tão rapidamente quanto haviam embarcado no trem da MT. A Associação para a Máquina de Tradução e Lingüística Computacional teve "máquina de tradução" raspada de seus letreiros. Mesmo Noam Chomsky que escrevera o iconoclasta Estruturas Sintáticas no MIT entrou na dança chamando a MT de fútil e sem sentido. A primeira tentativa de se iniciar uma conversação global usando computadores estava encerrada. O tal "inverno" percebe-se claramente em centros como a Universidade Carnegie Mellon, em Pittsburg não esfriou de vez os esforços para se chegar lá. Alex Waibel, diretor do Instituto de Tecnologia da Linguagem da universidade, é um dos mais resistentes sonhadores que começaram sua carreira acadêmica durante o "inverno da MT". Com forte sotaque alemão, Waibel é a encarnação do tradutor humano: nasceu em uma cultura, viveu em outra e casou-se com uma mulher de uma terceira (Japão). Em 1993, ele foi essencial na formação do C-Star, um consórcio internacional de empresas e instituições que está atrás da MT intérprete, aquela capaz de traduzir a linguagem falada em tempo real. Uma experiência importante na carreira do cientista foi a passagem pelo Instituto de Pesquisas Avançadas em Telecomunicação de Osaka, no Japão. Com economia local crescente e uma língua que parece ter-se desenvolvido independentemente das outras existentes, o Japão estava com muita vontade de investigar qualquer possibilidade de remediar seu isolamento lingüístico. Do Japão, ele se transferiu à Alemanha para auxiliar no lançamento do Verbmobil, um esforço massivo para a obtenção de uma MT intérprete que se baseava em domínios extremamente restritos do discurso agendar compromissos ou marcar viagens, por exemplo. Em Carnegie Mellon, Waibel colocou as mãos em projetos que iam desde o desenvolvimento de óculos especiais que funcionassem com legendas da língua falada acessório ideal para turistas até a tradução dos movimentos labiais por meio do uso de projeções fotorrealistas. Waibel leva-me ao seu laboratório para mostrar Janus, um sistema que traduz do inglês ou do alemão para o inglês, o alemão e o japonês. Estou sentado em frente a uma tela sensível ao toque e a um microfone quando sou convidado a marcar uma viagem com um agente alemão um estudante sentado do outro lado da sala. Falo em inglês, e o programa reconhecedor de voz transcreve na tela o que estou dizendo. Janus emprega o enfoque interlingüístico na MT, parecido com a Torre de Babel imaginada por Weaver. Minhas frases eram examinadas e passadas para representações de seu significado literal no código interlíngua. A partir daí, elas geravam as frases apropriadas na língua do interlocutor nesse caso, o alemão. Observo, gratificado, que as sentenças mostradas na tela são próximas em significado das minhas frases originais. Depois de aprovada a versão ou modificada com minhas próprias correções , a mensagem é traduzida e enviada ao computador-agente, onde é lida em voz alta, em alemão, por um sintetizador de voz. Suas respostas, também transcritas, corrigidas e traduzidas, emergem em inglês. Janus é um sistema MT baseado no conhecimento. Faz uso de técnicas de inteligência artificial para dar ao computador uma compreensão rudimentar dos significados das palavras que está traduzindo. A primeira geração de pesquisadores de MT, que tiveram acesso não apenas à capacidade de memória muito limitada, mas a processadores que se arrastavam, não tinham como incorporar no seu processo de tradução o que os teóricos da inteligência artificial chamavam de conhecimento do mundo. Como Alex Waibel, Teruko Mitamura e Eric Nyberg, da Carnegie Mellon, são fortes apelos públicos para demonstrar o êxito da MT. Tratam-se de duas pessoas de grande determinação que combinaram forças para trabalhar no mesmo campo. Desde 1991, Mitamura e Nyberg têm trabalhado intensamente em um universo de rebites, cilindros, bombas de ar e concreto em conjunto com a Caterpillar, produtora de máquinas pesadas de construção, no desenvolvimento de um sistema baseado no conhecimento chamado Kant. Kant é o redirecionamento de um experimento malsucedido que a Caterpillar fez nos anos 70 para criar o Inglês Fundamental Caterpillar, uma linguagem especial para seus manuais, que são traduzidos para mais de 20 línguas. O propósito original era compelir os funcionários de outros países a aprender apenas um inglês suficiente para que a companhia não tivesse de traduzir seus manuais. Não funcionou. Um aumento do número de termos técnicos ameaçava acabar com o frágil léxico do Inglês Fundamental. Muitos técnicos se recusaram a aprender esse idioma funcional. Com a escolha entre comprar retroescavadeira de um fabricante cujos manuais estavam escritos em seu próprio idioma e de outro que oferecia instruções em "inglês à prova de idiotas", ocorreu um verdadeiro adeus à Caterpillar. Por meio de uma sintaxe clara e limitando o vocabulário a 70 mil palavras e expressões, a quantidade de conhecimento e mapeamento lingüístico que tinha de ser absorvida pelo sistema de Kant era administrável. Ambigüidades que não podem ser evitadas são resolvidas por editores hu- manos. O sistema, que funciona em máquinas Unix da IBM, é usado para traduzir os manuais da Caterpillar para o francês, o espanhol e o alemão, com italiano, português e russo em fase de implantação. Hoje, a Caterpillar estima que o Kant permita aos editores da companhia trabalhar de duas a cinco vezes mais rápido. Aplicação bem diferente tem o Native Search, um novo software da IBM, que entrou no ar em 1999, na seção de alphaWorks do site da companhia. O Native Search permite que falantes do chinês usem navegadores de pesquisa como o Yahoo! em suas próprias línguas. Questões digitadas em caracteres chineses são convertidas ao inglês para alimentar os mecanismos de pesquisa; as páginas de resultados são traduzidas de novo para o chinês com sua formatação intacta. Native Search e Via Voice são apenas duas peças de uma nova forma de computação que será portátil e acionada pela voz, não pelo texto, aposta a IBM. Usando uma linguagem chamada VoiceXML para fazer o e-commerce migrar do computador para telefones que cabem no bolso de qualquer um, Big Blue está fazendo da conexão voz-rede (voice-Net) o eixo de uma estratégia ambígua para roubar da Microsoft o futuro da interface. Mesmo que o Spech Browser da IBM já esteja funcionado em alguns sites, as interfaces comerciais da voice-Net incorporando tradução estão provavelmente a alguns anos de distância por causa de recalcitrantes problemas de precisão da MT. "O que as pessoas realmente querem é o relógio do Dick Tracy que permita que falem em suas próprias línguas com tradução simultânea. Estamos chegando lá", empolga-se Ozzy Osborne (não é quem você está pensando), ex-administrador da Voice Systems, colocado pela IBM à frente de sua divisão MT. "O reconhecimento de voz nunca foi tão bom. Se nos tornarmos um sucesso da noite para o dia com a tradução da fala, será porque estivemos trabalhando nisso por 30 anos. O relógio de Dick Tracy? Mais cinco anos." Há um paradoxo, praticamente inevitável, para a MT: se você quer traduzir qualquer expressão espontânea, terá versões como as da Babel Fish. Se quer precisão, deve restringir o domínio do discurso a esferas pequenas. Para belas e precisas traduções de qualquer coisa que não seja a prosa técnica, tradutores humanos nunca serão derrotados por computador, mas, no emergente mundo da internet, é na arena da troca não-escrita como em chats e conversas telefônicas que as pessoas estão precisando mais da MT. E a rede mal pode esperar para que esses paradoxos sejam resolvidos. Um dos mais eloqüentes críticos da MT é Douglas Hofstadter. Autor do livro Le Ton Beau de Marot, ele considera que a MT é, essencialmente, um mau entendimento do funcionamento da linguagem. "Há exemplos de péssimas MTs. A linguagem comum contém uma grande quantidade de informação sutil em que espaço se está circulando, como são as pessoas, o que elas querem. Conhecemos esse espaço, porque vivemos nele." Hofstadter acredita que, no coração da comunicação, reside a comunhão desse conhecimento sutil em imagens mentais geradas por pistas de sons, sensações e associações. Reduzindo-se palavras a valores de sentidos literais, muito desse imaginário e o valor da troca estará perdido. Está claro que, ao fazerem seu trabalho como tradutores, os computadores terão de se basear no que há de mais humano em nós: a capacidade de negociar significados. Mesmo quando erros de arrancar os cabelos aparecem no diálogo de um chat, tudo pode ser relevado, considerando que a abertura para tolerar falhas de compreensão e imprecisões é o que mantém conversas em qualquer meio. A questão que permanece é por que a linguagem é tão intratável, tão resistente a ser subjugada por um cada vez maior poder de processamento sobre-humano. Uma das coisas que aprendemos desde os tempos de Weaver em parte por causa da pesquisa relacionada com a máquina de tradução é como as estruturas básicas comuns a todas as línguas parecem fazer parte de nossa herança genética. Bebês balbuciam para nós em castelhano e na entonação flutuante do cantonês. Mais que a representação de uma estrutura conceitual, uma matemática formal ou uma cifra complexa, a linguagem é como um sistema vivo que floresce dentro de nós: uma selvageria íntima em que nossos algoritmos não podem penetrar. |