A Minha Casa Digital: Google e Jigsaw apresentam Perspective

Post de Jared Cohen, President of Jigsaw

QUANDO OS COMPUTADORES APRENDEM A JURAR: UTILIZAR O MACHINE LEARNING PARA CONVERSAÇÕES MAIS ABERTAS

Rose Eveleth, uma jornalista freelance acordou numa manhã de Novembro e pensou que se tratava de um post inócuo - uma nota sarcástica sobre um cientista com uma t-shirt com imagens de mulheres pouco vestidas durante uma entrevista. E aí a sua vida mudou. Durante semanas, foi atacada e assediada online, outros publicaram informação pessoal dela e houve ainda ameaças de morte.

Mas Rose não é caso único. 72% dos utilizadores de Internet norte-americanos testemunharam assédio on-line e quase metade já viveu essa experiência. Quase um terço, auto-censura o que é publicado online com receios de represálias. Achamos que a tecnologia pode ajudar aqui.

Hoje, a Google e a Jigsaw dão os primeiros passos com a Perspective, uma nova tecnologia - num estádio inicial - que recorre ao machine learning para ajudar a identificar os comentários tóxicos. Os programadores terão acesso ao machine learning da Google através da API Perspective, e por isso publishers—incluindo os membros europeus da Digital News Initiative, uma parceria entre a Google e os publishers de notícias na Europa que visa apoiar o jornalismo de elevada qualidade através de inovação e do investimento - e também as plataformas poderão passar a utilizar esta tecnologia e ver como ela poderá ser útil nos seus websites respectivos e para pessoas como a Rose.

COMO FUNCIONA?

O Perspective revê os comentários e classifica-os com base na sua semelhança com comentários que as pessoas consideraram "tóxicos" ou que tenham levado alguém a abandonar a conversação. Para compreender como identificar a linguagem potencialmente tóxica, o Perspective examinou dezenas de milhar de comentários que foram marcados por revisores humanos. A cada momento, o Perspective encontra novos exemplos de comentários potencialmente tóxicos ou com o apoio de correcções dos utilizadores poderá melhorar a classificação de comentários futuros.

Os Publishers podem escolher o que pretendem fazer com a informação que obtêm do Perspective. Por exemplo, podem assinalar comentários para os seus próprios moderadores reverem e decidirem incluir ou não na conversação. Ou por exemplo, um publisher poderá disponibilizar ferramentas para ajudar a sua comunidade a perceber o impacto do que estão escrever - por exemplo, dando a conhecer a quem comenta o potencial tóxico do seu comentário à medida que está a escrever. Os publishers poderão até permitir apenas aos leitores ordenarem os comentários pelo seu nível de toxicidade tornando mais simples encontrar boas discussões escondidas sob outras tóxicas.

Estivemos a testar uma versão desta tecnologia com o The New York Times, onde uma equipa inteira vai "peneirando" e moderando cada comentário antes da sua publicação - revendo diariamente mais de 11.000 comentários. E mesmo este trabalho é demasiado para uma única equipa e por isso a publicação permite comentários em apenas cerca de 10% dos seus artigos. Trabalhámos em conjunto para treinar modelos que permitem aos moderadores da publicação ordenarem os comentários mais rapidamente e esperamos alargar diariamente a discussão a mais artigos.

E DAQUI EM DIANTE?

Perspective vem juntar-se ao TensorFlow em código aberto e à Google Cloud Machine Learning Platform como um dos muitos novos recursos da Google de machine-learning que são disponibilizados aos programadores. Esta tecnologia está ainda em processo de aprendizagem. Mas isto é o que o machine learning tem de fantástico — mesmo que os modelos sejam complexos eles irão melhorar ao longo do tempo. Quando o Perspective chegar aos publishers ele será exposto a mais comentários e conhecer ainda melhor o que torna determinados comentários tóxicos.

Ao mesmo tempo que melhoramos a tecnologia, estamos também a trabalhar para a alargar. O nosso primeiro modelo foi desenvolvido para identificar linguagem tóxica mas ao longo do próximo ano iremos distribuir novos modelos que funcionam com outros idiomas além do inglês bem como modelos que permitam identificar comentários que sejam ataques pessoais ou fora do tópico de discussão.

Perspective proporciona aos publishers uma ferramenta para receber conversações inclusivas. Mas isto é mais do que melhorar os comentários - trata-se de tornar a Internet num espaço onde a voz de todos possa ser escutada.

Google e Jigsaw apresentam Perspective

0 Comments:

Estatísticas Mensais