Type
masterThesis
Publisher
Identifier
GERALDES, Fernando Jorge Fernandes (2012) - Reconhecimento de imagens por câmara de smartphone em tempo real. Castelo Branco: Instituto Politécnico de Castelo Branco. Escola Superior de Tecnologia. X, 68 p. Relatório.
Title
Reconhecimento de imagens por câmara de smartphone em tempo real
Contributor
Metrôlho, José Carlos Meireles Monteiro
Date
2013-01-08T14:32:06Z
2013-01-08T14:32:06Z
2012
2013-01-08T14:32:06Z
2012
Description
Relatório apresentado à Escola Superior de Tecnologia do Instituto Politécnico de Castelo Branco para cumprimento dos requisitos necessários à obtenção do grau de mestre em Desenvolvimento de Software e Sistemas Interativos.
O reconhecimento de imagens nos dias de hoje é uma prática utilizada em vários âmbitos, tais como: reconhecimento de face, reconhecimento de código de barras e QR-Code, análise de imagens médicas, entre outras. Existem também já trabalhos que pretendem explorar o reconhecimento de imagens em tempo real através da câmara de smatphones, existindo já alguns protótipos. No entanto ainda nada existe em termos de produto comercial, e o que existe neste âmbito são aplicações que reconhecem imagens mas não em tempo real, e sim a partir da imagem captada por fotografia. Este projeto está dividido em 5 capítulos, introdução onde é descrito o propósito do projeto, um estado da arte onde se apresentam outros trabalhos nesta área, os métodos estudados para o prepósito do projeto, a implementação e a criação da API e no último capítulo são apresentados os resultados, verificação da performance da solução apresentada no reconhecimento dos objetos. Por último existe um capítulo onde são apresentadas algumas conclusões. Com este projeto pretende-se que o smartphone seja capaz de reconhecer imagens em tempo real, para que possa ser útil em várias aplicações destinadas ao público em geral, mas com o objetivo fundamental que é o de poder reconhecer as imagens e poder identificá-las através de voz para ajudar pessoas invisuais no reconhecimento de objetos, ou acrescentar informação às imagens para complementar a visão humana. A implementação da aplicação consiste em desenvolver uma API para a segmentação e análise da imagem (desenvolvida em linguagem C e C++) usando bibliotecas nativas do NDK Android, OpenCV para processar imagens, que está explicada na primeira parte desta dissertação. A segunda parte é composta pela implementação de uma aplicação Android em JAVA usando o SDK, e a integração da API desenvolvida na primeira parte com a aplicação, para que o objetivo principal seja alcançado. Para alcançar os objetivos, utilizamos várias técnicas de equalização, segmentação e reconhecimento de imagens, e também foi construída uma base de conhecimento inicial para o reconhecimento de objetos. Essa base de conhecimento abarca formas geométricas básicas como triângulos, círculos, quadrados e retângulos. Esse conhecimento é mais tarde alargado com a experiência e utilização do software como a recolha de imagens (formas) não reconhecidas inicialmente. O objetivo é ter uma API que reconheça qualquer objeto previamente inserido na base de conhecimento.
O reconhecimento de imagens nos dias de hoje é uma prática utilizada em vários âmbitos, tais como: reconhecimento de face, reconhecimento de código de barras e QR-Code, análise de imagens médicas, entre outras. Existem também já trabalhos que pretendem explorar o reconhecimento de imagens em tempo real através da câmara de smatphones, existindo já alguns protótipos. No entanto ainda nada existe em termos de produto comercial, e o que existe neste âmbito são aplicações que reconhecem imagens mas não em tempo real, e sim a partir da imagem captada por fotografia. Este projeto está dividido em 5 capítulos, introdução onde é descrito o propósito do projeto, um estado da arte onde se apresentam outros trabalhos nesta área, os métodos estudados para o prepósito do projeto, a implementação e a criação da API e no último capítulo são apresentados os resultados, verificação da performance da solução apresentada no reconhecimento dos objetos. Por último existe um capítulo onde são apresentadas algumas conclusões. Com este projeto pretende-se que o smartphone seja capaz de reconhecer imagens em tempo real, para que possa ser útil em várias aplicações destinadas ao público em geral, mas com o objetivo fundamental que é o de poder reconhecer as imagens e poder identificá-las através de voz para ajudar pessoas invisuais no reconhecimento de objetos, ou acrescentar informação às imagens para complementar a visão humana. A implementação da aplicação consiste em desenvolver uma API para a segmentação e análise da imagem (desenvolvida em linguagem C e C++) usando bibliotecas nativas do NDK Android, OpenCV para processar imagens, que está explicada na primeira parte desta dissertação. A segunda parte é composta pela implementação de uma aplicação Android em JAVA usando o SDK, e a integração da API desenvolvida na primeira parte com a aplicação, para que o objetivo principal seja alcançado. Para alcançar os objetivos, utilizamos várias técnicas de equalização, segmentação e reconhecimento de imagens, e também foi construída uma base de conhecimento inicial para o reconhecimento de objetos. Essa base de conhecimento abarca formas geométricas básicas como triângulos, círculos, quadrados e retângulos. Esse conhecimento é mais tarde alargado com a experiência e utilização do software como a recolha de imagens (formas) não reconhecidas inicialmente. O objetivo é ter uma API que reconheça qualquer objeto previamente inserido na base de conhecimento.
Access restrictions
openAccess
Language
por
Comments