Atividade de 22/08 a 26/08 - Banco de dados

SISTEMAS DE APOIO A DECISÃO- DATA MINING
Texto retirado do TCC de Ricardo Kremer – Blumenau 1999

A cada ano, companhias acumulam mais e mais informações em seus bancos de dados. Como consequência, estes bancos de dados passam a conter verdadeiros tesouros de informação sobre vários dos procedimentos dessas companhias. Toda esta informação pode ser usada para melhorar seus procedimentos, permitindo que a empresa detecte tendências e características disfarçadas, e reaja rapidamente a um evento que ainda pode estar por vir. Alguns exemplos disto são o crescimento dos mecanismos de leitura de preço nos supermercados, dos caixas eletrônicos, dos cartões de crédito, da televisão por assinatura, do home shopping, da transferência eletrônica de fundos, o processamento automático de pedidos, das bilheterias eletrônicas e outros.
Mas não se tem somente uma grande quantidade de dados sendo produzida; os dados também estão sendo extraídos cada vez mais dos sistemas de onde são gerados e alimentados em um Data Warehouse, tornando-se parte da memória da empresa [HAR98].
Segundo [INM97], um Data Warehouse “é um conjunto de dados baseado em assuntos, integrado, não-volátil, e variável em relação ao tempo, de apoio às decisões gerenciais”. Com toda esta informação disponível, seja em um Data Warehouse ou simplesmente em uma Base de Dados, tende a crescer cada vez mais a demanda por sistemas que forneçam informações precisas, que respondam às dúvidas da empresa e que proporcionem uma tomada de decisões mais acertada. Um tipo de sistema que possui estes aspectos é o Sistema de Apoio
à Decisão (SAD).
Conforme [SPR91], os Sistemas de Apoio à Decisão “são sistemas computacionais que ajudam os responsáveis pela tomada de decisões a enfrentar problemas estruturais através de uma interação direta com modelos de dados e análises”. No entanto, apesar do enorme valor desses dados, a maioria das organizações é incapaz de aproveitar totalmente o que está armazenado em seus arquivos. Esta informação preciosa está na verdade implícita escondida sob uma montanha de dados, e não pode ser descoberta utilizando-se sistemas de gerenciamento de banco de dados convencionais; elas precisam de um significado. O significado permite a análise dos dados observando modelos, estabelecendo mecanismos e tendo novas ideias para fazer previsões sobre o futuro. Com o uso do Data Mining pode-se acrescentar significado a esses dados.
Conforme [HAR98], o Data Mining, do modo como é usado o termo, é a exploração e análise, por meios automáticos ou semi-automáticos, de grandes quantidades de dados para descobrir modelos e regras significativas.
O Data Mining pode ser aplicado à tarefas como classificação, estimativas, previsões, agrupamento por afinidades ou reunião. Algumas destas técnicas são melhor executadas através de “testes hipotéticos”, onde os dados do passado são verificados para aprovar ou não idéias ou suposições obtidas em cima dos dados disponíveis. Além destes “testes hipotéticos” pode ser utilizado também a “descoberta de conhecimento”, onde os dados falam por si próprios. Este processo de “descoberta de conhecimento” pode ser de duas formas: a direcionada e a não direcionada. A forma direcionada tenta explicar ou categorizar alguns campos de dados, como receitas ou respostas. A descoberta de conhecimento não direcionada tenta encontrar modelos ou similaridades entre grupos de registros sem um campo-alvo específico ou um conjunto de classes predefinidas [HAR98].
O que o Data Mining faz é encontrar modelos interessantes nos dados. Mas não é isso, deve-se poder agir aos modelos, em última análise, transformando os dados em informações, as informações em ação, e a ação em valores.
Reconhecendo o Data Mining como uma forma de incorporar significado aos dados, propõe-se especificar e desenvolver um Sistema de Apoio à Decisões para previsões genéricas utilizando as técnicas de Data Mining.
A quantidade de informação armazenada em bancos de dados está explodindo, e ultrapassa a habilidade técnica e a capacidade humana na sua interpretação. De compras através de cartões de crédito a imagens pixel-a-pixel de galáxias, bancos de dados são medidos hoje em gigabytes e terabytes. A necessidade de transformar estes terabytes de dados em informações significativas é óbvia. Felizmente, técnicas computacionais foram desenvolvidas para analisar os dados, ou ao menos ajudar o analista a encontrar ordem no caos, ou seja, conhecimento.
Data Mining é uma tecnologia usada para revelar informação estratégica escondida em grandes massas de dados. É usada em diversas áreas, como análise de riscos, marketing direcionado, controle de qualidade, análise de dados científicos, etc. Data Mining define o processo automatizado de captura e análise de enormes conjuntos de dados, para então extrair um significado. Esta tecnologia está sendo usado para descrever características do passado, assim como predizer tendências para o futuro. Sua utilização permite avanços tecnológicos e descobertas científicas, além de garantir uma vantagem competitiva invejável.

Referencias do texto:
[HAR98] HARRISON, Thomas H. Intranet data warehouse. São Paulo : Berkeley
Brasil, 1998.
[INM97] INMON, William H. Como construir o data warehouse. Rio de Janeiro :
Campus, 1997.
[SPR91]  SPRAGUE, R. H., WATSON, H. J. Sistemas de apoio à decisão: colocando a teoria em prática. Rio de Janeiro : Campus, 1991.




Leia o artigo acima e os artigos que estarão disponíveis na central do aluno e responda as seguintes questões:

1.    O que é dataming e qual sua aplicação?
2.     O que é KDD? Quais suas aplicações?
3.    Cite algumas aplicações onde datamining pode ser utilizado
4.    Fale sobre as principais etapas do processo de KDD.
5.    O sistema apresentado no artigo é eficiente? Justifique.
6.    O que são redes neurais?
7.    O que seria uma arvore de decisões?

Quer conhecer mais sobre aplicações usando Banco de dados, assista também ao vídeo falando sobre BIGDATA acessando:  http://goo.gl/AeYOor


Assista aos vídeos disponíveis nos links abaixo:

Vídeo 1:
          http://goo.gl/oAXAoB 

Vídeo 2:

Com base nos vídeos, responda as seguintes questões:

1-    Ambos os vídeos falam sobre como é possível aprender “coisas” novas e treinar o seu cérebro. Cite algumas das técnicas de aprendizado citados nos vídeos.


2-    Com base nos vídeos e na sua experiência, quais estratégias você considera fundamentais para melhor aprender um determinado conteúdo?

Nenhum comentário:

Postar um comentário