Capítulo 60: Atribuindo um vetor às palavras
(Um comunicado: Atendendo aos pedidos dos leitores, a linha do tempo do romance foi alterada para começar em novembro de 2017; agora a história se passa em março de 2018. A ideia inicial, de começar no final de novembro de 2009, não era para copiar tecnologias já existentes, mas para alongar o período narrativo. Alguns leitores relataram que ambientar a história oito anos atrás diminui a sensação de imersão, pois há quem nunca tenha usado um celular Symbian. Por isso, fiz a alteração. Agora, a renda familiar do protagonista, o preço dos imóveis, os celulares e computadores usados correspondem ao cenário atual, sem maiores mudanças que afetem o desenrolar da narrativa. Caso notem alguma parte anterior não atualizada, por favor, avisem; não será descontado do número de palavras. Era isso.)
Xiao Ming lia atentamente as vantagens do idioma Pangu. O maior benefício era integrar toda a lógica e as regras do mandarim humano, permitindo que o significado da linguagem humana fosse transmitido diretamente à máquina.
Se utilizado nos computadores biológicos do planeta Pansha, o idioma Pangu poderia demonstrar ainda mais potencial; no entanto, ao ser usado em computadores binários, sua performance era apenas razoável.
Em seguida, Xiao Ming converteu o pacote de aplicativos que havia adquirido em um software de tradução.
No computador, surgiram as etapas detalhadas de programação do tradutor.
O pacote de aplicativos não entregava o aplicativo pronto; era necessário que Xiao Ming colocasse a mão na massa e programasse ele mesmo.
O verdadeiro ensinamento é ensinar a pescar, não dar o peixe.
Xiao Ming pensava consigo mesmo: seu inglês já havia melhorado bastante, não tinha mais grandes problemas com gramática. O maior obstáculo era o vocabulário reduzido e a dificuldade de compreensão auditiva e expressão oral — conseguia ler, mas não entendia ao ouvir, tampouco falava.
Esse era o dilema de grande parte dos estudantes do Reino de Verão ao aprender inglês.
Inglês é importante? No momento, sem dúvida. Muito do conhecimento científico e tecnológico da humanidade vem do Ocidente; sem domínio do inglês, não se compreende sequer artigos científicos internacionais, quanto mais fazer carreira acadêmica.
A maior mudança em Xiao Ming nos últimos seis meses foi sua capacidade de autocrítica. Mesmo em inglês, precisava se questionar e buscar melhorar.
Ele podia tirar prêmios de caixas-surpresa, podia trocar pontos por tecnologia, mas esses produtos dependiam de conhecimento tecnológico básico.
Se Xiao Ming não tivesse noções de biologia, não teria desenvolvido a bactéria Devorador 1; da mesma forma, sem noções de lógica, jamais programaria. Sem entender inglês, não acompanharia o progresso científico internacional.
Não existem almoços grátis; mesmo quem tem vantagens precisa se esforçar.
De volta à tela do computador, Xiao Ming teve uma ideia ousada: não queria apenas um tradutor, mas sim um software capaz de dialogar inteligentemente em inglês, ajudando a aprimorar rapidamente sua compreensão e expressão oral no idioma.
Seguindo as instruções do idioma Pangu, Xiao Ming pôs mãos à obra.
Primeiro, redigiu, na página de programação, o objetivo do aplicativo: traduzir com inteligência e precisão entre inglês e mandarim, além de dialogar com o usuário.
Depois, passou à escrita do código específico.
Xiao Ming tinha vocabulário restrito, mas não errava em gramática.
Ele analisou e concluiu que os maiores defeitos dos softwares e aparelhos de tradução no mercado atual eram dois.
Primeiro, a tradução imprecisa. Tanto em inglês quanto em mandarim, uma palavra pode ter múltiplos significados, variando conforme o contexto; mas a tradução automática não compreende completamente o que a pessoa quer expressar. Muitas vezes, o significado das palavras está correto, mas, no conjunto da frase, torna-se cômico.
Segundo, a dificuldade de reconhecer fala humana. Isso ocorre principalmente nos aparelhos de tradução: as pessoas possuem muitos sotaques e vícios de linguagem; o diálogo cotidiano está longe do padrão dos apresentadores de telejornal, que articulam cada frase perfeitamente.
Muitas vezes, o tradutor automático interpreta apenas o que consegue entender, e o resto traduz de forma aleatória. Por isso, muitos aparelhos de tradução frustram clientes no exterior e são inadequados para tradução simultânea em conferências.
Para atacar esses dois problemas, Xiao Ming seguiu as recomendações do manual.
Utilizou raciocínio matemático para definir cada palavra como um vetor, classificando-as como substantivo, verbo etc.
Definir palavras como vetores permitia dissecar frases longas e complexas, fazendo com que o tradutor tratasse cada termo com precisão.
O passo seguinte era filtrar e combinar palavras conforme o contexto, ajustando a gramática e o significado de acordo com as necessidades do idioma de destino e preenchendo eventuais lacunas gramaticais.
Com as dicas da linguagem de programação Pangu, Xiao Ming sabia que sua lógica estava correta.
Mas lógica era só o início; o desafio era combinar os vetores de palavras segundo a gramática para formar novas frases — uma tarefa difícil, que é o maior obstáculo para tradutores automáticos modernos.
Mas isso era justamente o ponto forte do Pangu.
Pangu ofereceu a Xiao Ming várias interfaces de integração.
Ele importou grandes volumes de material em chinês e inglês: não apenas clássicos, mas também romances de internet, fóruns de perguntas e respostas, postagens em redes sociais como Weibo e Twitter.
No futuro, esses materiais poderiam ser enviados pelos próprios usuários, otimizando a precisão do programa.
O banco de dados de Pangu integraria todo esse material, familiarizando-se com o contexto de cada frase, e então estruturando modelos de dados (simulando padrões de pensamento e expressão de mandarim, inglês, etc.).
Esses dados ajudariam os “vetores de palavras” a ocupar a posição adequada em diferentes contextos e estruturas gramaticais, tornando a tradução mais precisa.
O maior desafio era o volume de compilação exigido!
Por isso, os tradutores atuais utilizam bancos de gramática criados por linguistas; alguns poucos programas aprendem sozinhos, mas nenhum cobre completamente todos os usos e costumes linguísticos vigentes, tampouco os analisa. Daí as traduções mecânicas e cheias de erros.
Para as próximas integrações, Xiao Ming conectou o sistema às salas de transmissão ao vivo gratuitas do país inteiro, onde apresentadores falavam tanto em mandarim padrão quanto em dialetos locais, representando o discurso coloquial de forma exemplar.
O idioma Pangu coletaria amostras de fala e entonação de todas as regiões, categorizando e compilando-as, formando assim um banco de dados de voz correspondente ao de texto.
A programação em Pangu era simples; não exigia a digitação de códigos, bastava informar a lógica pretendida, e a linguagem executava o comando.
E então...
O computador travou completamente, a ponto de superaquecer!
Todo o trabalho de Xiao Ming foi por água abaixo em questão de minutos.
Droga...
O notebook de Xiao Ming era um Asus comum, com processador i7 8550u.
Era impossível processar tantos dados sem travar!
Xiao Ming olhou as horas: já passava das três da manhã.
“Preciso de um conjunto de servidores,” murmurou ele, deitando-se na cama para continuar refletindo sobre a lógica do software de tradução e assistente de aprendizado de inglês.
Nos dias seguintes, Xiao Ming manteve-se calado na escola.
Fora os exercícios essenciais de matemática e ciências, dedicava quase todo o tempo à leitura de inglês e chinês.
Os colegas do grupo escolar sabiam que Xiao Ming estava abatido desde que o professor da Universidade Shuimu partira, por isso não o incomodaram.
Dias depois, Xiao Ming pediu cem mil yuans ao pai e comprou online quatro servidores montados com processadores Intel Xeon E5-2603v4, contratando também o serviço de instalação em domicílio. Investiu ainda em uma conexão empresarial de fibra óptica dedicada.
Ver todo aquele dinheiro desaparecer em um dia lhe doía o coração.
Dois setores são, sem dúvida, os mais lucrativos do mundo!
Um é o de chips da Intel, o outro é o de telecomunicações.
O jovem técnico que instalava os servidores, ao ver Xiao Ming com olheiras e ar desleixado por noites sem dormir, cochichou: “Vai montar um site de transmissões ao vivo? Meu amigo, a fiscalização está dura, é melhor alugar servidores no exterior; montar por conta própria é arriscado!”
Xiao Ming ficou sem palavras. “E você, não quer virar assinante? Dá para fazer atendimento individual.”
O técnico riu sem jeito: “Não, obrigado.”