Преземање на податоци
Google Chrome Scraper екстензијата
Екстензијата за „гребење“ е еден од наједноставните начини за добивање на податоци од некоја веб-страна. Едноставно обележите ги секциите кои сакате да ги преземете, десен клик на глушецот и од менито изберете “scrape similar…” („греби слично…“). Екстензијата овозможува и посложени „гребења“ на податоци преку xpath опциите.
Google Spreadsheets
Формулата =importHTML() во Google Spreadsheet ви овозможува импортирање на едноставни html табели и листи во Google Spreadsheets. Нема повеќе да имате потреба од препишување или од копирање и лепење на податоци.
Scraperwiki
Кога податоците кои сакате да ги преземете од веб стануваат се поголеми и покомплицирани, обратете се кај Scraperwiki за помош. Станува збор за платформа во стилот на Wiki која ви овозможува да впишувате код, складирате податоци и редовно да „гребете“ податоци. Оваа платформа поддржува и „гребење“ на PDF документи.
gImageReader + Tesseract
Се што имате е скениран документ или PDF? Има спас – OCR. gImageReader ви овозможува од скениран документ да извлечете текст.
Чистење на податоци
Open Refine
Нечисти податоци? Каде ќе се обратите? Open Refine! Неодамна купен од страна на Google, овој проект е една од
Анализирање на податоци
Табеларни пресметки
Табеларните пресметки се одлична алатка за основни податочни анализи. Откако ќе ја совладате упторебата на формули, едноставните анализи нема да ви претставуваат никаков проблем.
R
Моќен јазик во работењето со податоци. Можеби звучи примамливо да научите програмирање само за да може да вршите анализи, но R е толку моќен што ви го препорачуваме да го ѕирнете веднаш штом ќе започнете со справување со посериозни податочни прашања.
Gephi
Доколку сакате да преминете еден чекор погоре од табели кон анализирање на мрежи и графици, обратете се кај Gephi. Моќна алатка за визуелизација и анализа на мрежи (се мисли на социјални мрежи, пример врската помеѓу политичари и компании, и сл.)
Прикажување на податоци
Tile Mill
Tile Mill ви овозможува да креирате мапи од податоци без да мора да бидете GIS експерт. Едноставен и интуитивен за употреба – испробајте го!
Fusion Tables
Fusion Tables е Google алатка за визуелизација на податоци. Нуди едноставно геокодирање (внесување на податоци на мапа) и многу повеќе од тоа. Доколку барате онлајн алатка за визуелизација – испробајте ја оваа.
Gephi
Го споменавме и во алатките за анализа на податоци – Gephi ви овозможува да визуелизирате податоци во графици и мрежи.
D3
D3 е javascript библиотека за креирање на документи базирани на податоци. Иако можеби е комплициран за совладување, резултатите се прекрасни. Тука ќе најдете огромен број на кодови на кои ќе може да ги базирате вашите визуелизации!
Споделување на податоци
The Datahub
Сакате да ги споделите вашите податоци со сите? Обратете се кај Datahub. Станува збор за портал на кој заедницата ги споделива своите податоци.
Google Docs
Еден од наједноставните начини за споделување на документи – едноставно употребете ги поставките за споделување во вашиот Google Doc (Гугл документ) и упатете ги другите каде може да ги најдат!
Github
Сакате да споделите повеќе од податоци? Можеби и некои скрипти? Github е тука да ги координира вашите напори за социјално кодирање, а на другите им нуди можност да ви предложат промени и подобрувања.