Captcha (“Completely Automated Public Turing test to tell Computers and Humans Apart” ou “teste de Turing público completamente automatizado para diferenciar entre computadores e humanos”) é um termo inventado em 2000 por Luis von Ahn, por Manuel Blum, Nicholas J. Hopper (todos da universidade do Carnegie-Mellon), e por John Langford (da IBM), que corresponde a um teste que pode distinguir seres humanos dos computadores.
O captcha é formado por três partes:
- uma imagem (normalmente .jpg ou .png, formada normalmente por um fundo com letras e números e, às vezes, destorcida ), gerada por um código.
-
um código alfanumérico (dígitos e letras contidos na imagem) , o qual deve ser preenchido em um campo de um formulário. O usuário deve digitar o que para ele mais se assemelha à imagem, e os dados digitados são enviados, através de um botão, para validação.
- um código separado, geralmente escrito em PHP, para validação do código digitado pelo usuário. (Veja mais em http://www.captcha.biz/)
Em princípio, os algoritmos para transformar uma imagem em texto (o que um programa faria para burlar a proteção) são bastante complexos. Eles usam uma tecnologia conhecida como OCR (“Optical Character Recognition” ou “Reconhecimento Óptico de Caracteres”). O OCR reconhece caracteres a partir de um arquivo de imagem, possibilitando a digitalização de uma folha de texto impresso para a obtenção de um texto editável, por exemplo. Para dificultar ainda mais o reconhecimento de caracteres através de OCR, a imagem no CAPTCHA possui pontos e linhas, ou ainda é destorcida, tentando confundir o bot o máximo possível. Assim, o computador tem uma tarefa em princípio insana para resolver o CAPTCHA, assumindo-se então que uma solução correta dada só pode ser feita presumivelmente por um humano.
Leia Mais
Filed under: Dica do dia, Internet, Novidades & Curiosidades | Tagged: bot, captcha, OCR, spam, teste de Turing, teste de Turing reverso | 2 Comments »