Orange
[Orange] é um programa que possibilita a mineração de dados de uma forma frutífera e divertida através de seu [software] de código aberto, <https://github.com/biolab/orange3>, que trabalha com aprendizado de máquina (machine learning) e visualização de dados (data visualization). Pode ser utilizado tanto por usuários iniciantes quanto especialistas. Seus fluxos de trabalho são baseados em análise de dados interativos atrelados a uma grande opção de ferramentas, incluindo uma variedade de técnicas de visualização, exploração, pré-processamento e modelagem de dados. Pode ser usado através de uma interface de usuário agradável e intuitiva ou, para usuários mais avançados, como um módulo para a linguagem de programação Python. Considerando que através da mineração de dados busca-se, entre outras relações, identificar padrões de similiridade ou de não conformidade nos conjuntos de dados, o Orange oferece diversos recursos de base estatística para o processamento dos dados.
Índice
[ocultar]Origem
O software é desenvolvido pelo [Laboratório de Bioinformática] dentro da Faculdade de Informação e Computação na Universidade de Ljubljana localizada na Eslovênia, e por ser de código aberto conta com a colaboração desta comunidade. Em 2018, a ferramenta completa seu vigésimo primeiro ano de história e este longo tempo é motivo de destaque, pois atesta a maturidade, segundo seus criadores, desta iniciativa dentro de um ambiente efêmero como o de desenvolvimento e lançamento de softwares.
Licença
Sobre o software é permitido sua redistribuição e/ou modificação sob os termos da [Licença Pública Geral GNU], publicada pela [Free Software Foundation]. A documentação, conteúdo do site, assim como outros conteúdos não relacionados aos códigos do software estão licenciados sob a forma de [Creative Commons Attribution-ShareAlike].
Instalação
Na [página] são disponibilizadas diferentes opções de instalação há versões para [Windows], [Linux] e [Mac]. É possível baixar um instalador com a última versão, neste caso, o Orange e o Miniconda serão instalados no seu computador, outra opção é realizar o download do Orange e Python ou ainda pode-se dentro do Python instalar o pacote Orange.
Características
O programa trabalha com arquivos nos formatos:
. Excel, arquivos delimitados por vírgulas e tabulações (.xlsx, .csv, .tab);
. Dados on-line no format do Google Planilhas;
. Imagens (.jpg, .tiff, .png) através do complemento ImageAnalytics;
. Arquivos de texto (.txt, .docx, .odt) com o complemento, Orange3-Corpus; e
. Banco de dados PostgreSQL e MSSQL, por meio do complemento SQL.
Com estes arquivos é possível criar um fluxo de trabalho de análise de dados. A instalação padrão inclui vários algoritmos de aprendizado de máquina, pré-processamento e visualização de dados em seis conjuntos de complementos (dados, visualização, classificação, regressão, avaliação e não supervisionados). Assim é possível ler os dados, mostrar uma tabela de dados, selecionar recursos, comparar algoritmos de aprendizado, visualizar elementos de dados, etc. Um exemplo do fluxo de trabalho no Orange.
Documentação
O site fornece uma excelente documentação sobre a ferramenta, disponibilizando tutoriais [em vídeo], um guia para os primeiros passos, instruções para a utilização dos próprios dados e uma página explicando como utilizar cada um dos complementos disponibilizados por padrão na ferramenta. A página sobre a [documentação] se divide em três partes a primeira, com as informações já descritas, uma segunda com dados sobre desenvolvimento e a última com instruções sobre a biblioteca de mineração de dados.
Guia para o Usuário: Funções e Comandos
O programa analisado disponibiliza diversas possibilidades. Aqui será apresentada uma noção geral para fins de uso nas Humanidades Digitais.
Painel Geral:
Nas imagens abaixo, é apresentado o layout do Orange com as Funções e Ferramentas disponíveis para o uso. Na imagem do painel geral é possível reconhecer os principais grupos de Funções, na barra superior; os principais conjuntos de Ferramentas, na lateral esquerda; e Funções complementares, à esquerda na parte de baixo.
Funções e Comandos:
Aplicações/Exemplos
Uso com Texto:
Uso com Dados Numéricos:
Referências
Orange Change Log. Acesso em 25/06/2018. Disponível em < https://github.com/biolab/orange3/blob/master/CHANGELOG.md> Janez Demšar; Tomaž Curk; Aleš Erjavec; Črt Gorup; Tomaž Hočevar; Mitar Milutinovič; Martin Možina; Matija Polajnar; Marko Toplak; Anže Starič; Miha Stajdohar; Lan Umek; Lan Žagar; Jure Žbontar; Marinka Žitnik; Blaž Zupan (2013). "Orange: data mining toolbox in Python" (PDF). JMLR. 14 (1): 2349–2353. Acesso em 25/06/2018. Disponível em < http://jmlr.org/papers/volume14/demsar13a/demsar13a.pdf> Orange - Download. Acesso em 25/06/2018. Disponível em < https://orange.biolab.si/download/windows/>