Pandas, uma biblioteca em Python para análise de dados até para principiantes (com alguns casos práticos).

Os recursos disponíveis na internet trazem novas ferramentas para que análise de dados que até então eram normalmente pagas e bastante especializadas. Nos dias atuais, excelentes ferramentas para análises de dados estão disponíveis em linguagem de programação como Python, que poderão ser utilizadas por profissionais de outras áreas além da computação. Após a Lei da Transparência (Lei 12.527/11), houve uma explosão de dados públicos na internet. A obtenção de informação a partir dos dados disponibilizados poderá ser de mais valia para diversos profissionais, tais como ativistas sociais, jornalistas investigativos e operadores de direito que lidam com entes públicos. Nesta palestra, busca-se a apresentar Pandas. Uma biblioteca open source, com alta perfomance e de fácil uso para a linguagem python. O seu uso exige o conhecimento de iniciante em python. A abordagem buscará demonstrar os principais formas de importação e exportação de dados. A seguir, serão apresentadas as principais formas de manipulação e apresentação de dados. Por fim, serão apresentados alguns casos demonstram as possibilidades de desenvolvimento com a ferramenta, a exemplo: A análise da folha de pagamento de Patos e a criação de uma base de dados SQLITE com os dados abertos das folhas de pessoal da paraíba, disponíveis em http://dados.tce.pb.gov.br, com a manipulação dos dados durante a sua criação e a utilização de tais dados para a criação de um diagrama de contratados por excepcional interesse público.