"The Seven Ages of Information Retrieval" Michael Lesk [1995]
Comentado por Margarida Afonso


Em "The Seven Ages of information Retrieval", Michael Lesk utiliza uma analogia com as "seven ages of man" de Shakespeare [Shakespeare 1599] para apresentar uma análise sistematizada das etapas evolutivas do Armazenamento e Recuperação de Informação. Essas etapas, que serão abordadas com maior detalhe mais à frente, são: infância (1945-1955), adolescência (anos 60), idade adulta (anos 70), maturidade(anos 80), crise de meia-idade (anos 90), fullfilement (inicio do século XXI) e reforma (década 2010).

Actualmente, surgem preocupações de caracter ético e social, que concernem as implicações sociais da utilização que é hoje feita dos sistemas de recuperação de informação (em particular a internet, o mais utilizado). Preocupações tais como os abusos comerciais, liberdade de informação, liberdade de acesso à informação, direitos de autor, monopólios comerciais, igualdade de acesso a recursos de informação, direitos de expressão das minorias estão cada vez mais presentes nos debates sobre a evolução de uma sociedade que se pretende cada vez mais global e justa.

Vencidos todos os desafios técnicos de armazenamento e recuperação de informação, tornar-se-á necessário um esforço para que esses meios se tornem efectivamente acessíveis à esmagadora maioria da população.





Infância (1945-1955)

Este período é iniciado com o artigo publicado por Vannevar Bush em 1945. Neste artigo de Michael Lesk faz-se uma análise crítica comparativa entre as previsões e o que realmente aconteceu. Algumas das pervisões concretizaram-se (como os computadores) outros ainda estão aquém das expectativas (OCR, reconhecimento de voz). Este foi o período em surgiram ´ os primeiros sistemas de recuperação de informação, como os KWIC indexes ou o WRU Searching selector.

Adolescência (anos 60)

Este foi um período de grandes expectativas eno qual surgiram os primeiros sistemas de informação em grande escala. Alguns dos fornecedores de conteúdos actuais, tais como a Dialog ou BRS, tiveram a sua origem nesta década. Foram diversas experíências, tais como o sistema Recon (NASA) que utilizava um pesquisa mecânica de indexação manual. Surgiu também, neste período, a ideia da indexação de texto-livre (free text): seria possível recuperar qualquer documento no qual ocorresse uma determinada palavra sem necessidade de recorrer à indexação manual. Na sequência da identificação de algumas necessidades de optimização no procedimento de pesquisa de texto livre (mais do que encontrar a palavra exacta é importante encontrar a palavra certa) foram desenvolvidos os primeiros Thesauros. Neste período encontramos os primeiros esforços para avaliar os mecanismos de recuperação de informação: taxa de revocação, percisão. Encontramos também algumas das técnicas mais importantes da recuperação de informação: relevance feedback, multilingual retrieval (bilingual Thesauros), (início da pesquisa sobre) natural language processing.

Idade Adulta (anos 70)

A idade adulta assistiu ao surgimento dos processadores e texto e computer type setting, bem como aos primeiros sistemas de time-sharing. Surgiram também os primeiros sistemas de armazenamento ev recuperação de infromação em larga escala: Dialog, OCLC. Surgem também alguns sistemas de recuperação de informação como evoluções de jornais (Toronto Globalm Nuew York Times Information Bank).

Maturidade (anos 80)

Na maturidade, sugiram o CD-ROM (novo meio de distribuição de informação) bem como mais e novas bases de dados para pesquisa. A maturidade foi também uma consequência da evolução tecnológica, como por exemplo a consolidação dos processadores de texto disponibilizando um grande volume de conteúdos em formato electrónico. A diminuição de custos de espaço contribuiu também para a evolução dos sistemas de recuperação de informação. Surgem aqui as primeiras experiências com statistical retrieval e os esforços de codificar o conhecimento humano (artificial intelligence). No final desta década a informação disponível on-line tornou-se comum (ainda que não utilizada por um público alargado).

Crise de Meia Idade (anos 90)

Na década de 90 assistimos ao alargamento ao cidadão comum da utilização de serviços online de recuperação de informação BRS after dark, Dialog knowledge Index). Não existe, no entanto, um alargamento efectivo da utilização a toda a população já que apenas 15% possuem modem. Apesar da evolução no campo da pesquisa, veridica-se que poucos algoritmos de recuperação de informação são utilziados em aplciações comerciais). Neste período surge a distribuição de imagens digitalizadas e a distribuição livre de informação através da teia global (world wide web) com alguns esforços pessoais de classificação da informação gerada.

Fullfilement (início século XXI)

Em relação a este períod, Lesk apresenta as suas expectativas de evolução: desenvolvimento da pesquisa sobre a recuperação de informação armazenada em imagens ou som, generalização do livro digital, cooperative browsing.

Reforma (década de 2010)

Em relação à idade da reforma, Lesk faz uma futurologia optimista: muito tabalho está feito no entanto há ainda desafios para vencer: digitalização de manuscritos antigos, utilização generalizada de multimedia como meio de difusão de informação, reconceptualização das metodologias educativas por forma a explorar ao máximo o potencial dos meios disponíveis para o armazanemento e a recuperação de informação, desenvolvimento de métodos para lidar eficientemente com multilínguas, rede semântica ("nova" internet).