Препорачани алатки

Преземање на податоци

Google Chrome Scraper екстензијата

1Екстензијата за „гребење“ е еден од наједноставните начини за добивање на податоци од некоја веб-страна. Едноставно обележите ги секциите кои сакате да ги преземете, десен клик  на глушецот и од менито изберете “scrape similar…” („греби слично…“). Екстензијата овозможува и посложени „гребења“ на податоци преку xpath опциите.

 

 

Google Spreadsheets

2Формулата =importHTML() во Google Spreadsheet  ви овозможува импортирање на едноставни html табели и листи во Google Spreadsheets. Нема повеќе да имате потреба од препишување или од копирање и лепење на податоци.

 

 

 Scraperwiki

3Кога податоците кои сакате да ги преземете од веб стануваат се поголеми и покомплицирани, обратете се кај Scraperwiki за помош. Станува збор за платформа во стилот на Wiki која ви овозможува да впишувате код, складирате податоци и редовно да „гребете“ податоци. Оваа платформа поддржува и „гребење“ на PDF документи.

 

 

 

 gImageReader + Tesseract

4Се што имате е скениран документ или PDF? Има спас – OCR. gImageReader ви овозможува од скениран документ да извлечете текст.

 

 

 

 

Чистење на податоци

Open Refine

8570737075_710d853631_qНечисти податоци? Каде ќе се обратите? Open Refine! Неодамна купен од страна на Google, овој проект е една од

 

 

 

 

Анализирање на податоци

Табеларни пресметки

7

Табеларните пресметки се одлична алатка за основни податочни анализи. Откако ќе ја совладате упторебата на формули, едноставните анализи нема да ви претставуваат никаков проблем.

 

 

 

R

8

Моќен јазик во работењето со податоци. Можеби звучи примамливо да научите програмирање само за да може да вршите анализи, но е толку моќен што ви го препорачуваме да го ѕирнете веднаш штом ќе започнете со справување со посериозни податочни прашања.

 

 

Gephi

logo_about_2Доколку сакате да преминете еден чекор погоре од табели кон анализирање на мрежи и графици, обратете се кај Gephi. Моќна алатка за визуелизација и анализа на мрежи (се мисли на социјални мрежи, пример врската помеѓу политичари и компании, и сл.)

 

 

 

Прикажување на податоци

Tile Mill

10Tile Mill ви овозможува да креирате мапи од податоци без да мора да бидете GIS експерт. Едноставен и интуитивен за употреба – испробајте го!

 

 

 

 

Fusion Tables

11Fusion Tables е Google алатка за визуелизација на податоци. Нуди едноставно геокодирање (внесување на податоци на мапа) и многу повеќе од тоа. Доколку барате онлајн алатка за визуелизација – испробајте ја оваа.

 

 

 

Gephi

logo_about_2

Го споменавме и во алатките за анализа на податоци – Gephi ви овозможува да визуелизирате податоци во графици и мрежи.

 

 

 

D3

д3D3 е javascript библиотека за креирање на документи базирани на податоци. Иако можеби е комплициран за совладување, резултатите се прекрасни. Тука ќе најдете огромен број на кодови на кои ќе може да ги базирате вашите визуелизации!

 

 

 

Споделување на податоци

The Datahub

10Сакате да ги споделите вашите податоци со сите? Обратете се кај Datahub. Станува збор за портал на кој заедницата ги споделива своите податоци.

 

 

 

Google Docs

googledocsЕден од наједноставните начини за споделување на документи – едноставно употребете ги поставките за споделување во вашиот Google Doc (Гугл документ) и упатете ги другите каде може да ги најдат!

 

 

 

Github

github

Сакате да споделите повеќе од податоци? Можеби и некои скрипти? Github е тука да ги координира вашите напори за социјално кодирање, а на другите им нуди можност да ви предложат промени и подобрувања.

 

 

 

Comments are closed, but trackbacks and pingbacks are open.