Capítulo 60: Atribuindo um vetor às palavras

A Era da Tecnologia Avançada do Gênio dos Estudos Mastigar palavras e roer papel 2700 palavras 2026-03-04 17:15:56

(Um comunicado: Atendendo aos pedidos dos leitores, a linha do tempo do romance foi alterada para começar em novembro de 2017; agora a história se passa em março de 2018. A ideia inicial, de começar no final de novembro de 2009, não era para copiar tecnologias já existentes, mas para alongar o período narrativo. Alguns leitores relataram que ambientar a história oito anos atrás diminui a sensação de imersão, pois há quem nunca tenha usado um celular Symbian. Por isso, fiz a alteração. Agora, a renda familiar do protagonista, o preço dos imóveis, os celulares e computadores usados correspondem ao cenário atual, sem maiores mudanças que afetem o desenrolar da narrativa. Caso notem alguma parte anterior não atualizada, por favor, avisem; não será descontado do número de palavras. Era isso.)

Xiao Ming lia atentamente as vantagens do idioma Pangu. O maior benefício era integrar toda a lógica e as regras do mandarim humano, permitindo que o significado da linguagem humana fosse transmitido diretamente à máquina.

Se utilizado nos computadores biológicos do planeta Pansha, o idioma Pangu poderia demonstrar ainda mais potencial; no entanto, ao ser usado em computadores binários, sua performance era apenas razoável.

Em seguida, Xiao Ming converteu o pacote de aplicativos que havia adquirido em um software de tradução.

No computador, surgiram as etapas detalhadas de programação do tradutor.

O pacote de aplicativos não entregava o aplicativo pronto; era necessário que Xiao Ming colocasse a mão na massa e programasse ele mesmo.

O verdadeiro ensinamento é ensinar a pescar, não dar o peixe.

Xiao Ming pensava consigo mesmo: seu inglês já havia melhorado bastante, não tinha mais grandes problemas com gramática. O maior obstáculo era o vocabulário reduzido e a dificuldade de compreensão auditiva e expressão oral — conseguia ler, mas não entendia ao ouvir, tampouco falava.

Esse era o dilema de grande parte dos estudantes do Reino de Verão ao aprender inglês.

Inglês é importante? No momento, sem dúvida. Muito do conhecimento científico e tecnológico da humanidade vem do Ocidente; sem domínio do inglês, não se compreende sequer artigos científicos internacionais, quanto mais fazer carreira acadêmica.

A maior mudança em Xiao Ming nos últimos seis meses foi sua capacidade de autocrítica. Mesmo em inglês, precisava se questionar e buscar melhorar.

Ele podia tirar prêmios de caixas-surpresa, podia trocar pontos por tecnologia, mas esses produtos dependiam de conhecimento tecnológico básico.

Se Xiao Ming não tivesse noções de biologia, não teria desenvolvido a bactéria Devorador 1; da mesma forma, sem noções de lógica, jamais programaria. Sem entender inglês, não acompanharia o progresso científico internacional.

Não existem almoços grátis; mesmo quem tem vantagens precisa se esforçar.

De volta à tela do computador, Xiao Ming teve uma ideia ousada: não queria apenas um tradutor, mas sim um software capaz de dialogar inteligentemente em inglês, ajudando a aprimorar rapidamente sua compreensão e expressão oral no idioma.

Seguindo as instruções do idioma Pangu, Xiao Ming pôs mãos à obra.

Primeiro, redigiu, na página de programação, o objetivo do aplicativo: traduzir com inteligência e precisão entre inglês e mandarim, além de dialogar com o usuário.

Depois, passou à escrita do código específico.

Xiao Ming tinha vocabulário restrito, mas não errava em gramática.

Ele analisou e concluiu que os maiores defeitos dos softwares e aparelhos de tradução no mercado atual eram dois.

Primeiro, a tradução imprecisa. Tanto em inglês quanto em mandarim, uma palavra pode ter múltiplos significados, variando conforme o contexto; mas a tradução automática não compreende completamente o que a pessoa quer expressar. Muitas vezes, o significado das palavras está correto, mas, no conjunto da frase, torna-se cômico.

Segundo, a dificuldade de reconhecer fala humana. Isso ocorre principalmente nos aparelhos de tradução: as pessoas possuem muitos sotaques e vícios de linguagem; o diálogo cotidiano está longe do padrão dos apresentadores de telejornal, que articulam cada frase perfeitamente.

Muitas vezes, o tradutor automático interpreta apenas o que consegue entender, e o resto traduz de forma aleatória. Por isso, muitos aparelhos de tradução frustram clientes no exterior e são inadequados para tradução simultânea em conferências.

Para atacar esses dois problemas, Xiao Ming seguiu as recomendações do manual.

Utilizou raciocínio matemático para definir cada palavra como um vetor, classificando-as como substantivo, verbo etc.

Definir palavras como vetores permitia dissecar frases longas e complexas, fazendo com que o tradutor tratasse cada termo com precisão.

O passo seguinte era filtrar e combinar palavras conforme o contexto, ajustando a gramática e o significado de acordo com as necessidades do idioma de destino e preenchendo eventuais lacunas gramaticais.

Com as dicas da linguagem de programação Pangu, Xiao Ming sabia que sua lógica estava correta.

Mas lógica era só o início; o desafio era combinar os vetores de palavras segundo a gramática para formar novas frases — uma tarefa difícil, que é o maior obstáculo para tradutores automáticos modernos.

Mas isso era justamente o ponto forte do Pangu.

Pangu ofereceu a Xiao Ming várias interfaces de integração.

Ele importou grandes volumes de material em chinês e inglês: não apenas clássicos, mas também romances de internet, fóruns de perguntas e respostas, postagens em redes sociais como Weibo e Twitter.

No futuro, esses materiais poderiam ser enviados pelos próprios usuários, otimizando a precisão do programa.

O banco de dados de Pangu integraria todo esse material, familiarizando-se com o contexto de cada frase, e então estruturando modelos de dados (simulando padrões de pensamento e expressão de mandarim, inglês, etc.).

Esses dados ajudariam os “vetores de palavras” a ocupar a posição adequada em diferentes contextos e estruturas gramaticais, tornando a tradução mais precisa.

O maior desafio era o volume de compilação exigido!

Por isso, os tradutores atuais utilizam bancos de gramática criados por linguistas; alguns poucos programas aprendem sozinhos, mas nenhum cobre completamente todos os usos e costumes linguísticos vigentes, tampouco os analisa. Daí as traduções mecânicas e cheias de erros.

Para as próximas integrações, Xiao Ming conectou o sistema às salas de transmissão ao vivo gratuitas do país inteiro, onde apresentadores falavam tanto em mandarim padrão quanto em dialetos locais, representando o discurso coloquial de forma exemplar.

O idioma Pangu coletaria amostras de fala e entonação de todas as regiões, categorizando e compilando-as, formando assim um banco de dados de voz correspondente ao de texto.

A programação em Pangu era simples; não exigia a digitação de códigos, bastava informar a lógica pretendida, e a linguagem executava o comando.

E então...

O computador travou completamente, a ponto de superaquecer!

Todo o trabalho de Xiao Ming foi por água abaixo em questão de minutos.

Droga...

O notebook de Xiao Ming era um Asus comum, com processador i7 8550u.

Era impossível processar tantos dados sem travar!

Xiao Ming olhou as horas: já passava das três da manhã.

“Preciso de um conjunto de servidores,” murmurou ele, deitando-se na cama para continuar refletindo sobre a lógica do software de tradução e assistente de aprendizado de inglês.

Nos dias seguintes, Xiao Ming manteve-se calado na escola.

Fora os exercícios essenciais de matemática e ciências, dedicava quase todo o tempo à leitura de inglês e chinês.

Os colegas do grupo escolar sabiam que Xiao Ming estava abatido desde que o professor da Universidade Shuimu partira, por isso não o incomodaram.

Dias depois, Xiao Ming pediu cem mil yuans ao pai e comprou online quatro servidores montados com processadores Intel Xeon E5-2603v4, contratando também o serviço de instalação em domicílio. Investiu ainda em uma conexão empresarial de fibra óptica dedicada.

Ver todo aquele dinheiro desaparecer em um dia lhe doía o coração.

Dois setores são, sem dúvida, os mais lucrativos do mundo!

Um é o de chips da Intel, o outro é o de telecomunicações.

O jovem técnico que instalava os servidores, ao ver Xiao Ming com olheiras e ar desleixado por noites sem dormir, cochichou: “Vai montar um site de transmissões ao vivo? Meu amigo, a fiscalização está dura, é melhor alugar servidores no exterior; montar por conta própria é arriscado!”

Xiao Ming ficou sem palavras. “E você, não quer virar assinante? Dá para fazer atendimento individual.”

O técnico riu sem jeito: “Não, obrigado.”