Resumo do VII Encontro de usuários Python de Pernambuco (PUG-PE)

Olá pessoal,

Mais um novo encontro do PUG-PE foi realizado, desta vez nossa parada foi na faculdade FIR em Recife-PE. Foi um ótimo encontro onde tivemos palestras sobre diversas áreas (infelizmente não tivemos a minha e nem a de Bruno Melo ambas na área de I.A. devido ao atraso no início do encontro) e até um II coding dojo em Python.

Recomendo a leitura sobre o encontro no blog do PUG-PE:

http://pugpe.wordpress.com/2010/09/19/resumo-vii-encontro-pug-pe/

Por sinal olha eu aí apresentando a nova camisa oficial do PUG-PE!

Eu como mestre de cerimônias no PUG-PE


Até a próxima,

Marcel Caraciolo
Olá pessoal,

Gostaria de divulgar um excelente livro que que li recentemente sobre mobilidade e marketing chamado #Mobilize.

Para aqueles interessados em mobile marketing e entender como funciona este universo, especialmente no cenário Brasileiro, ele é um must-read.

Alguns pontos interessantes são o destaque para a tecnologia SMS ainda muito utilizada no Brasil e o acesso à internet pelos celulares Xing-Ling MPx.

O livro é gratuito, para fazer o download visite o site:


Até a próxima,
Marcel

Vídeo sobre a visão da IBM de um sistema de trânsito inteligente


Conversando com meu amigo  Rafael Carício aqui no IM, ele me mostrou um vídeo muito interessante criado pela IBM falando sobre a concepção de um  sistema de trânsito inteligente.  O projeto apresentado parece ser sensacional e um dos módulos descritos pela jovem que narra o sistema no vídeo casa com uma das minhas idéias que tive em construir um sistema de zona azul social que nos avisa quando uma nova vaga próxima está disponível.

A visão da jovem e da IBM logicamente é a construção de um sistema de trafégo inteligente onde as ruas, estacionamentos, semáforos fossem todos integrados permitindo a comunicação das condições de trânsito para um usuário seja por meio de um dispositivo móvel como um GPS ou celular. 

Imagine você antes de sair de casa em direção ao trabalho receber um SMS com informações de trânsito das principais avenidas do Recife, ou que a BR-101 em um determinado trecho está em obras.

Não sei quando isso estará em pronto, mas sem dúvidas gostaria muito de me envolver com esse tipo de tecnologia que é essencial para a explosão demográfica de habitantes e o trânsito caótico nas principais metropóles. 


Segue o link do vídeo:





Atenciosamente,

Marcel Caraciolo

Olá a todos,

Poucos conhecem esta classe escondida em Python, mas que tem me ajudado bastante na construção de pequenos parsers e analisadores léxicos em alguns projetos que estou trabalhando. Estou falando do módulo "re", responsável pelo uso de expressões regulares em códigos Python cuja uma das classes  não documentadas oficialmente, o Scanner  pode nos auxiliar nestas tarefas.

A classe Scanner ainda não documentada oficialmente por estar ainda em experimentação pode ser bastante útil no processo de tokenização de textos, uma fase de pré-processamento importante em mineração de textos.

O seu uso é bastante simples, basta passar como parâmetro uma lista de expressões regulares e suas respectivas funções callback. Quando uma string é "casada", a mesma é convertida em um respectivo token por meio da chamada da função callback associada e assim adicionada à uma lista de tokens a serem retornados. Se o scanner atinge um ponto em que não há um token a ser "casado",  o mesmo retorna a lista de tokens identificados até aquele ponto e o restante do texto em string que não foi casado.

Vamos a um exemplo prático!  Um dos cenários para o seu uso é os tweets espalhados pelo microblog social Twitter.  Se quisessémos construir um simples analisador léxico para separar links, hashtags, usernames e texto poderíarmos fazer de diversas maneiras. Entretanto com a classe re.Scanner esta atividade torna-se bem mais eficiente e rápida visto que ela já abstrai ao desenvolvedor a necessidade de implementar um analisador que varre as strings à busca de expressões regulares definidas pelo desenvolvedor.

Então se montarmos nosso scanner para extrair dados do twitter conforme a figura abaixo:

Exemplo de Extrator de Tweets

E executá-lo, veremos como resultado:

Resultado do Scanner

Podemos observar pela figura acima que após executar nosso pequeno parser, conseguimos extrair com sucesso os tokens relacionados a Retweets, nomes de usuários, palavras, HashTags e até URl's . Para quem trabalha com processamento de linguagem natural (NLP) isto pode ser uma útil ferramenta para a fase de pré-processamento em mineração de textos.

Com isso concluo a apresentação da classe Scanner escondida na biblioteca padrão que vem ao Python.
Quem não entender muito o que vem nessas strings que começam com  r'', visite meu post sobre expressões regulares, pode ser útil para quem está começando!

Espero ter ajudado pessoal,

Atenciosamente,

Marcel Caraciolo

Referências:

Olá pessoal,

Gostaria de divulgar o próximo encontro do PUG-PE, que está na sua sétima edição ! Fico muito feliz em poder participar deste grupo que vem em constante expansão!

Cartaz de Chamada para o VII Encontro do PUG-PE

Para este encontro, teremos uma palestra minha sobre Inteligência Artificial (algo mais voltado para coisas que eu pesquiso hoje no meu mestrado: Análise de Sentimentos, Recomendações, etc), uma sobre Processamento de Linguagem Natural (NLP) com Bruno Melo, uma sobre Redes Neurais com Péricles Miranda.

Não podemos esquecer da palestra sobre Python Web com uma introdução ao framework Django com Filipe Varjão e por fim uma palestra convidada especial que será ministrada por Lauro Moura do Instituto Nokia de Tecnologia (INDT) sobre Python e Mobile. 

E não esquecendo de adicionar o nosso II Coding-Dojo com programação em Python!

Um evento deste nível e gratuito, vocês não podem perder né?!   Será realizado na FIR dia 18/09 (Sábado) a partir das 08:00.

Mais informações ver a grade completa no blog oficial do grupo.

Atenciosamente,

Marcel Caraciolo
top