Ambiente de Gerenciamento de Imagens e Dados Espaciais para Desenvolvimento de Aplicações Ambientais

Ricardo da Silva Torres (Doutorando)
Orientadores:
Claudia Bauzer Medeiros (Orientador)
Alexandre Xavier Falcão (Orientador)

Laboratório LIS - Instituto de Computação  UNICAMP

Grupo de Banco de Dados

É crescente a preocupação com a conservação do meio ambiente. Para permitir iniciativas nesta área, é necessário disponibilizar um grande número de informações ambientais e softwares para gerenciá-las. Consequentemente, há uma demanda por acesso seguro, objetivo e atualizado das informações ambientais. Sistemas de informação ambiental são uma resposta a esta demanda.

Os principais desafios nestes sistemas são a necessidade de mecanismos de interação com usuário para facilitar especificação de consultas; a dificuldade em combinar mecanismos de consulta por conteúdo a bancos de imagens e consulta a bancos de dados geográficos; e a complexidade do gerenciamento diferenciado de dados de natureza tão distinta. Estes desafios envolvem trabalhos em duas frentes: banco de dados e processamento de imagens.

O objetivo da tese é especificar e implementar um protótipo de ambiente que combine o gerenciamento de imagens de seres vivos e dados espaciais para aplicações ambientais. As principais contribuições esperadas são: especificação de um ambiente para gerenciamento integrado de fotos, mapas e dados convencionais; implementação parcial deste ambiente para um tipo específico de imagem (peixes) e perfil de usuário e elaboração de uma metodologia para a validação do sistema de consultas.


  1. Introdução
  2. Arquitetura do Sistema
  3. Contribuições Esperadas

1. Introdução

É crescente a peocupação com a conservação do meio ambiente. Para permitir iniciativas nesta área, é necessário disponibilizar um grande número de informações ambientais e softwares para gerenciá-las. Mudanças ambientais têm emergido como uma importante questão na agenda global. Consequentemente, há uma demanda por acesso seguro, objetivo e atualizado das informações ambientais. Sistemas de informação ambiental são uma resposta a esta demanda. Eles enfocam o meio ambiente e os recursos minerais, visando o gerenciamento de dados sobre o solo, a água, o ar e sobre as diversas espécies de animais e plantas existentes.

As aplicações nas áreas ambientais e gerenciais têm como características marcantes o grande volume de dados envolvidos e o geo-referenciamento destes dados (aplicações geográficas).

Em alguns casos, os dados incluem também fotos de paisagens ou de seres vivos. No entanto, exceto no caso de imagens de sensoriamento remoto (satélite, radar, etc.), imagens são mantidas a parte do banco de dados propriamente dito. O ideal, em função da demanda dos usuários, seria integrar todos estes dados sob um único tipo de gerenciamento. Em especial, uma grande gama de aplicações requer consultas específicas às imagens, típicas em banco de dados de imagens, mas não disponíveis em outros tipos de sistema (dentre outras, as chamadas consultas por conteúdo). Basicamente não existe nenhum ambiente que integre gerenciamento conjunto de fotos e de dados espaciais para aplicações ambientais (exceção feita, como já mencionado, às  imagens de sensoriamento remoto, cujo uso, no entanto, é totalmente distinto do uso dos outros tipos de imagem).

Os principais desafios a serem considerados em sistemas de informação ambientais são a necessidade de mecanismos de interação com usuário para facilitar especificação de consultas; a dificuldade em combinar mecanismos de consulta por conteúdo a bancos de imagens e consulta a bancos de dados geográficos; e a complexidade do gerenciamento diferenciado de dados de natureza tão distinta. Estes desafios envolvem trabalhos em duas frentes: banco de dados (contendo imagens e dados geográficos) e processamento de imagens.

O processamento de imagens é responsável por toolboxes contendo algoritmos que manipulam o conteúdo das imagens (objetos e suas propriedades de forma, cor e textura). Em outras palavras, visa extrair e descrever o conteúdo das imagens de forma que a descrição possa ser utilizada para indexar as imagens e manipulá-las segundo este conteúdo, em um banco de imagens. Para efeito da tese, o conteúdo de uma imagem é definido como o conjunto de objetos (flores, peixes, etc.) que a compõem. Embora vários projetos referenciem recuperação por conteúdo, a maioria destes usa características de toda imagem, e não de seus objetos.

Bancos de imagens apresentam diversos desafios do ponto de vista de pesquisa e implementação, envolvendo problemas que vão desde questões de armazenamento até interfaces amigáveis. O complicador reside no fato de que os objetos envolvidos (imagens) são muito mais complexos de gerenciar do que objetos textuais. Do ponto de vista de armazenamento, imagens ocupam muito espaço. Além disso, a indexação de imagens deixa de ser uma questão de processamento de strings e passa a depender de outras características, inclusive diferentes aspectos cognitivos relativos à interpretaçãoo visual. Vários outros problemas - linguagens de consulta, atualização - contribuem para atrair cada vez mais pesquisadores para esta área.

Bancos de dados geográficos são repositórios de informação coletada empiricamente sobre fenômenos do mundo real (por exemplo, florestas, rios, cidades). À semelhança de bancos de imagens, apresentam desafios tanto teóricos quanto de implementação. Parte destes desafios é devida à natureza intrínseca dos dados geográficos.
Estes dados ocupam muito espaço, e variam com o tempo. Além disso, são geralmente provenientes de fontes diferentes de aquisição de dados com níveis distintos de generalização e escalas incompatíveis. Outro complicador reside no fato de que a dimensão espacial introduz questões de restrição de integridade espacial e processamento de consultas espaciais. E mais, estratégias padrão de otimização de consultas nem sempre são adequadas para dados geográficos.

O objetivo da tese é especificar e implementar um protótipo de ambiente que combine o gerenciamento de imagens de seres vivos e dados espaciais para aplicações ambientais. O enfoque será na combinação de recuperação baseada em conteúdo de bancos de imagens com recuperação baseada em localização e características geográficas e ecológicas. Consultas típicas por conteúdo, no contexto ambiental, envolvem predicados do tipo "todas imagens contendo animais com uma certa forma/cor''. Já consultas geográficas típicas, no contexto ambiental, têm predicado do tipo "todas as regiões contendo áreas de preservação ambiental''. Um exemplo de consulta combinada, que se deseja processar no ambiente alvo da tese, é "mostre as regiões contendo áreas de preservação ambiental, onde se encontram animais com esta forma/cor''.

O trabalho terá dupla orientação: uma em banco de dados (Profa. Claudia Bauzer Medeiros - orientadora principal) e outra em processamento de imagens (Prof. Alexandre Xavier Falcão).

O sistema será especificado em alto nível e de uma forma genérica, mas a implementação será realizada utilizando imagens de peixes. Estas imagens serão fornecidas por biólogos da USP e da UNESP especialistas em peixes, que já dispõem de uma grande coleção de dados deste tipo. Numa segunda etapa, serão usados dados do sistema FISHBASE, um sistema disponível na Web de gerenciamento textual de dados de peixes e que contém um grande número de fotos. O trabalho, nesta fase, será assesorado por um ictiólogo francês do Museu de História Natural da França.

A principal vantagem é que os requisitos de consultas e gerenciamento de dados serão fornecidos e testados por usuários do domínio alvo. Um primeiro conjunto de imagens, inclusive, já foi disponibilizado para este trabalho.

Apesar de aplicar-se a um domínio específico, esta pesquisa se justifica pela crescente demanda por sistemas com estas características, pela complexidade associada aos requisitos deste tipo de sistema e pela limitação de técnicas e protótipos existentes nesta área.


2. Arquitetura do Sistema

  A arquitetura definida  para o sistema  e apresentada na  Figura 1 define vários módulos:
 
 


Figura 1: Arquitetura do Sistema




 

3. Contribuições Esperadas

As contribuições esperadas são tanto práticas quanto teóricas e combinam resultados em processamento de imagens e banco de dados, a saber: