Dnia 14.12. w Warszawie odbędzie się seminarium „Research data in the humanities”. Organizatorem tego spotkania jest ICM UW.
Dnia 14.12. w Warszawie odbędzie się seminarium „Research data in the humanities”. Organizatorem tego spotkania jest ICM UW.
Gdy zaczynałem przygodę z przeteważaniem języka naturalnego i analizą danych naturalnym wyborem środowiska pracy był język skryptowy PHP, dzięki obsludze protokołów sieciowych oraz baz danych stanowił świetne narzędzie. Jego zaletami są elastyczność i niesamowita integracja z HTMLem.
Jednakże niedługo potem popularnosć zaczął zyskiwać język skryptowy Python. Jego zaletami są prostota programowania oraz niesamowita szybkość przetwarzania danych. Zestawy danych przetwarzane w PHP przez 48 godzin Python przetwarza w kilkanaście minut. Coraz większa rzesza entuzjastów tego języka przyczynia się do bardzo dynamicznego rozwoju rozwiązań dostępnych dla analityków danych. Oto niektóre z nich:
SPARC EUROPE udostępniło na stronach projektu Foster poradnik, jak wizualizować dane związane z promocją open access.
Obchodzimy właśnie w POlsce Tydzień Otwrtej Nauki. Instytucje naukowe promują nowe modele komuniakcji naukowej organizując szereg imprez z tej okazji. W tym roku jest ich już 29 i stale przybywają nowe.
Jednym z najleszych środowisk programistycznych do analizy i wizualizacji danych jest język python (MATLAB lub R również sobie nieźle z tym radzą). Za jego pomocą można bardzo szybko i skutecznie wyznaczyć cechy poszczególnych dokumentów, ustalić podobieństwo dokumentów według różnych miar oraz wygenerować plik graficzny z wizualizacją analizowanych danych (np. dendrogram, mapę, itp.).
Strona 2 z 4