Por décadas, os cientistas que criam artigos que apresentam fórmulas matemáticas geralmente usam o LaTeX, uma linguagem projetada para produzir páginas impressas em forma estática, como PDFs.
Uma ferramenta desenvolvida no NIST pode transformar esses artigos em páginas da web, que podem ser visualizadas mais facilmente em diferentes dispositivos e satisfazer solicitações de longa data de leitores com necessidades de acessibilidade visual.
O servidor de pré-impressão arXiv começou a usar a ferramenta para oferecer seus milhões de artigos nos formatos PDF e página da Web.Crédito: N. Hanacek/NIST
As fórmulas complexas em artigos de física, matemática e engenharia podem ser intimidante e difíceis de ler para alguns, mas há muitas pessoas que têm dificuldade em simplesmente vê-las em primeiro lugar.
O National Institute of Standards and Technology (NIST) criou uma ferramenta que facilita a visão de pessoas com deficiência visual e está prestes a ser adotada de forma importante.
A ferramenta, que converte um formato comumente usado para exibir fórmulas matemáticas em outro, pode ajudar a tornar os melhores e mais recentes artigos de pesquisa acessíveis a todos. A maioria dos novos artigos de pesquisa são distribuídos como arquivos PDF, que muitas pessoas na comunidade de pesquisa têm dificuldade em ler.
De acordo com a Organização Mundial da Saúde, mais de um quarto da população mundial tem uma deficiência visual diagnosticada, e o Centro de Dislexia e Criatividade de Yale relata que nos Estados Unidos 20% das pessoas têm dislexia. Em um estudo de artigos científicos distribuídos em PDFs, os pesquisadores descobriram que apenas 2,4% dos documentos amostrados satisfaziam seus critérios de acessibilidade.
“Se você não é alguém que tem lutado para publicar artigos de matemática a vida toda, você pode se perguntar por que isso é um problema”, disse Bruce Miller, do NIST, um físico de formação especializada em software de matemática. “Os PDFs ficam ótimos na página impressa. Mas se você quiser que as fórmulas matemáticas sejam lidas em voz alta ou sejam legíveis em uma tela de tamanho diferente, como um tablet ou um telefone, o descompasso pode ser doloroso. Você não pode facilmente redirecionar PDFs para outras mídias.”
Como os PDFs são normalmente gerados? Um cientista que cria um manuscrito de papel que usa muitas fórmulas geralmente usa a linguagem LaTeX (pronuncia-se “lay-tech”) ou um de seus parentes próximos para renderizar as fórmulas. O LaTeX está em uso desde a década de 1980 e é amplamente respeitado pela formatação de alta qualidade que cria, mas é projetado para produzir páginas impressas em forma estática.
Desde a década de 1990, os criadores de páginas da Web usam HTML, o que torna possível ajustar a aparência, o comportamento e o layout do texto exibido dependendo de seu contexto. Se você já arrastou uma página da Web para um tamanho diferente e viu seu texto se reposicionar suavemente para se encaixar dentro dos limites do novo retângulo, você está vendo um recurso que os leitores com deficiência visual desejam.
O HTML moderno inclui extensões que não apenas permitem que essa capacidade de “refluir” o tipo, mas também permitem que as fórmulas matemáticas sejam lidas em voz alta por máquina para aqueles que não podem ler o texto por conta própria. Esses recursos tornam o HTML ideal para criar texto acessível, mas durante anos não havia uma maneira eficaz de converter LaTeX em HTML. Isso representou um problema para Miller quando ele precisava de uma maneira de trazer as mais de 1.000 páginas do venerável Manual de Funções Matemáticas do NIST para o reino digital.
“Na época, alguns programas pretendiam converter o LaTeX em páginas da Web, mas nenhum funcionava bem o suficiente”, disse ele. “Eu imaginei, vamos tentar fazer o nosso.”
A ferramenta NIST resultante foi LaTeXML, que lê um arquivo de origem LaTeX e constrói uma representação do documento que pode ser transformada em HTML. O LaTeXML foi a chave para a criação da Biblioteca Digital de Funções Matemáticas on-line e, vários anos depois, os gerentes de um importante recurso on-line perceberam que também poderia ajudá-los.
Esse recurso é o arXiv pronuncia-se “arquivo”), um repositório de artigos acadêmicos que ainda não foram publicados em revistas científicas. Mantido pela Universidade de Cornell, o arXiv atualmente hospeda mais de 2 milhões de artigos que são gratuitos para visualização e download como PDFs. O servidor tornou-se uma estação de caminho proeminente, onde os autores podem postar descobertas e discuti-las com seus pares antes de anunciá-las formalmente.
“De acordo com uma pesquisa realizada pela arXiv em 2022, apenas 30% dos usuários que dependem da tecnologia assistiva podem acessar todas as pesquisas de que precisam sem ajuda. A mesma pesquisa descobriu que a formatação de PDF é a maior barreira”, disse Shamsi Brinn, pesquisador-chefe do relatório e gerente do projeto de artigos HTML.
Isso mudará com o uso do conversor LaTeXML pelo arXiv, disse Brann. O servidor irá gerar versões HTML de artigos e incluir a versão HTML ao lado do link para baixar um PDF.
O repositório arXiv converterá papéis em uma base contínua, oferecendo o primeiro em dezembro de 2023. A medida segue uma tendência mais ampla de exigir informações acessíveis na web e eletrônicas, de acordo com Joe Zesski, diretor assistente do Centro.
A mudança não apenas ajudará a comunidade científica a aderir à política atualizada da Casa Branca de tornar a pesquisa financiada pelo governo federal disponível gratuitamente, mas também tornará a informação acessível a jovens cientistas, que cresceram usando recursos eletrônicos.
“Há uma crescente dependência da web e da informação eletrônica na educação, juntamente com uma expectativa crescente de acesso igualitário por e para jovens com deficiência”, disse Zesski. “Tomar medidas para tornar as informações que esses alunos precisarão acessar acessíveis e utilizáveis para eles é importante.”
Fonte: NIST
Next steps in preparing for post-quantum cryptography
Is Your Cybersecurity Strategy Falling Victim to These 6 Common Pitfalls?
The freedom of citizenship – the new path of Brazilian identity
Sobre National Institute of Standards and Technology (NIST)
O National Institute of Standards and Technology (NIST) foi fundado em 1901 e agora faz parte do Departamento de Comércio dos EUA. O NIST é um dos laboratórios de ciências físicas mais antigos do país. O Congresso estabeleceu a agência para remover um grande desafio à competitividade industrial dos EUA na época – uma infraestrutura de medição de segunda linha que ficou atrás das capacidades do Reino Unido, Alemanha e outros rivais econômicos.
Da rede de energia elétrica inteligente e registros eletrônicos de saúde a relógios atômicos, nanomateriais avançados e chips de computador, inúmeros produtos e serviços dependem de alguma forma da tecnologia, medição e padrões fornecidos pelo Instituto Nacional de Padrões e Tecnologia.
Hoje, as medições do NIST suportam a menor das tecnologias até a maior e mais complexa das criações feitas pelo homem – de dispositivos em nanoescala tão pequenos que dezenas de milhares podem caber na extremidade de um único cabelo humano até arranha-céus resistentes a terremotos e redes globais de comunicação.
O Crypto ID trilhou um caminho incrível!
Ao longo de uma década, fomos além das inovações e tendências, tornando-nos referência em segurança digital, identificação e privacidade.
Neste marco tão especial, renovamos nosso compromisso com um mundo digital mais seguro e confiável.
Agradecemos a todos que fizeram e fazem parte dessa trajetória – parceiros, colunistas, colaboradores, assessorias de imprensa e a nossa comunidade! Juntos, estamos construindo um futuro em que empresas, máquinas e pessoas possam confiar muito mais umas nas outra.