Linguagem Documental
Uma palavra-chave é uma palavra ou expressão representada em linguagem natural (aquela que usamos todos os dias), que é extraída durante a análise de um documento e que melhor caracteriza o seu conteúdo. Ou seja, são as palavras que melhor representam o assunto (ou assuntos) de um documento que estudamos e que devemos registar.
Exemplo de palavras-chave: se estivermos a consultar um texto cujo assunto seja História da colonização do Brasil no século XVIII, pode-se extrair História do Brasil, Colonização do Brasil (ou só Colonização), História de Portugal, ou só Brasil.
Deve-se eliminar os sinónimos e os quase-sinónimos, assim como os termos polissémicos (palavras que têm vários sentidos), as siglas, as abreviaturas e as palavras estrangeiras que têm equivalente na língua em que se esteja a escrever de forma a evitar "ruído" ou ambiguidades.
Habitualmente, chama-se "índice" ao que, tecnicamente, se deve denominar "sumário" (também há quem lhe chame "tábua de conteúdo"), mas há muito poucos editores e autores que utilizam esta última denominação.
O termo "índice de capítulos" era um termo que antigamente se atribuía ao sumário. Entretanto, esta expressão deixou de ser usada, mas os autores e os editores abreviaram a expressão para "índice"e continuam a utilizá-la em vez de sumário.
Sumário: "lista de títulos e subtítulos das partes de um documento, segundo a ordem pela qual se apresentam num texto e com indicação das páginas ou das colunas em que essas partes começam", apresentando assim um resumo do conteúdo do documento.
Índice: documento secundário, ou seja, documentos cuja informação deriva de documentos originais (documentos primários). Destina-se a localizar a informação contida num documento de forma rápida. Normalmente, um índice aparece-nos no fim dos documentos, como anexo, mas há casos em que constituem documentos independentes.
Como se organiza um índice: trata-se de uma lista de termos seleccionados a que se associa notações com a localização da referência ao termo nos documentos.
O índice pode ser geral ou específico. No caso de ser um índice específico pode conter os termos de pessoas (onomástico), lugares, matérias, etc. Normalmente apresenta-se por ordem alfabética dos termos, mas também pode ser apresentada por ordem de frequência decrescente (índice hierárquico).
Exemplo: se num índice surgir "abside 27, 35, 48", o termo "abside" é acompanhado das notações 27, 35, 48. Isto significa que o referido termo consta na obra nas páginas 27, 35, 48. O leitor, se só quiser saber o que diz a obra em causa sobre absides, consulta as páginas indicadas sem ter que ler toda a obra. É um instrumento importante para investigadores ocupados!
Quando se procura um documento numa biblioteca que não se sabe se existe ali ou não se sabe onde está depositado, pode-se fazer uma pesquisa a partir do CATÁLOGO. Este é o instrumento que nos permite aceder a essa informação. Funciona como chave de acesso para a colecção de uma biblioteca ou conjunto de bibliotecas (como é o caso do Catálogo Colectivo da Rede de Bibliotecas da Mealhada).
Todo o processo de catalogação de um documento obedece a uma NORMALIZAÇÃO INTERNACIONAL. Cada documento entrado é sujeito a um TRATAMENTO DOCUMENTAL, gerando-se para cada um registo escrito (ficha bibliográfica) que contém diversos elementos que permitem aceder-lhe, descrevê-lo e localizá-lo.
Hoje em dia, este registo é quase sempre informatizado e, em muitos casos, já acessível através da Internet. Mas ainda existe algumas bibliotecas em que estas fichas são feitas em pequenos rectângulos de cartão e cujo acesso tem de ser obrigatoriamente presencial. Em todo o caso, em todas as bibliotecas do Concelho da Mealhada agregadas no Catálogo Colectivo a catalogação é toda informatizada e acessível on-line.
FICHA BIBLIOGRÁFICA:
? PONTOS DE ACESSO (ou cabeçalho): é o elemento de entrada no documento e pelo qual se faz a sua busca. Normalmente, procura-se pelo autor ou autores ou pelo assunto, porque era assim que se organizava os catálogos antigamente. Mas os novos meios tecnológicos permitem-nos também procurar pelo título, pela data, pelo editor e por outros elementos. Até permite cruzar estes elementos (OPERAÇÕES BOOLEANAS). Num catálogo informatizado, que é o caso das nossas bibliotecas integradas no catálogo colectivo deste portal, as possibilidades de pesquisar são muitas.
? A DESCRIÇÃO faz a caracterização do documento nos seus diversos elementos, entre os quais a autoria ou autorias (responsabilidade), título, edição (local, editor, data), descrição física, entre outros possíveis. Permite-nos saber como é o documento.
? ZONA DA COTA: cada ficha também nos diz onde está depositado através da cota, indicando-nos o caminho para lá chegar. Nas nossas bibliotecas, a cota é composta a partir da tabela da Classificação Decimal Universal (CDU), à qual se junto elementos do autor e outro do título. A arrumação é feita de acordo com o tema ou assunto do documento. Contudo, como há documentos com suportes diferentes e que exigem estantes próprias, também se arruma a colecção de acordo com o tipo de suporte. É difícil colocar um DVD ou CD-ROM junto a um livro. Assim, cada suporte tem a sua estante própria, mas em cada uma, os documentos são arrumados por temas de acordo com a tabela CDU.
No que respeita ao assunto ou assuntos tratados no documento, há duas formas de exprimir a informação contida no documento: a INDEXAÇÃO e a CLASSIFICAÇÃO.
Um exemplo de CLASSIFICAÇÃO é a Classificação Decimal Universal (C.D.U.), que é a usada nas bibliotecas do nosso Concelho para classificar e também para elaborar cotas.
A INDEXAÇÃO é feita a partir de listas de termos controlados em linguagem natural, ou seja, a cada documento aplica-se um ou vários termos que representem o tema ou temas aí tratados e em que a linguagem utilizada é aquela que usamos todos os dias (daí se chamar natural). Mas estes termos têm de ser controlados para evitar a utilização de sinónimos e outros casos que possam provocar ambiguidades.
Um dos instrumentos usados neste controlo é o thesaurus, que é uma lista de autoridade de termos e que obedece a regras muito próprias e rigorosas. Traduz as noções expressas em linguagem natural numa linguagem artificial, a linguagem documental, em que se procura retirar toda a ambiguidade que um determinado termo possa conter.
Quando não se tem acesso a um instrumento tão sofisticado, costuma-se elaborar uma lista de autoridade menos rigorosa e de cariz algo precário.
Vejamos o exemplo clássico de "casamento" e "matrimónio", que, não querendo dizer exactamente a mesma coisa, são usados normalmente como sinónimos. Se tivéssemos dois documentos na biblioteca sobre o tema e aplicássemos a um o termo "casamento" e a outro "matrimónio" um leitor que fizesse uma pesquisa por um dos termos só recuperava um documento e não os dois. Para evitar esta ambiguidade, a biblioteca deverá adoptar apenas um dos termos e utilizar sempre o mesmo critério, elaborando uma lista de termos a usar e indicando a forma como os respectivos sinónimos e quase-sinónimos deverão ser reconvertidos nos termos adoptados. Os thesaurus (ou tesauros), são listas de termos organizados por especialistas e tecnicamente mais evoluídos do que uma simples lista de termos controlados.
Dissemos acima que deveremos registar logo desde o início as palavras-chave referentes ao tema que estamos a tratar. Quando fazemos uma pesquisa por assunto ou tema (indexação ou classificação), é muito importante saber "fazer as perguntas" no catálogo ou no motor de busca e, para isso, podemos utilizar as palavras-chave.
Para se fazer uma pesquisa ainda mais eficientemente através do assunto, devemos associar as palavras-chave aos termos controlados. Estes termos são chamados cabeçalhos de assuntos, os quais consistem numa palavra ou conjunto de palavras representando o(s) assunto(s) contido(s) no documento mas sem ambiguidades. A grande diferença entre palavras-chave e cabeçalhos de assuntos é que os primeiros não são controlados e podem produzir ruído e os segundos são controlados e os resultados poderão ser mais fiáveis.
Esta operação vai permitir que os termos sirvam de ponto de acesso a partir do tema ou assunto. Chamamos aos termos controlados que servem para aceder ao documento "cabeçalho de assunto".
Mais acima referimos que podemos estabelecer acesso ao documento de muitas formas. Uma delas é pelo assunto. Uma pesquisa pelos "cabeçalhos de assuntos" é, em princípio, mais eficiente no que respeita a consulta de catálogos de qualidade.
Nos motores de busca do tipo Google tanto faz, uma vez que nestes instrumentos não há controlo dos termos utilizados e, consequentemente, produz-se uma recuperação de qualidade relativamente baixa.