Kategorie
Analiza danych Zrób to sam

Analiza danych w języku R – odcinek 9

W dziewiątym odcinku Poradnika dotarliśmy do obliczeń agregujących. Wielu użytkowników Excela zostało tu solidnie sponiewieranych, bo choć same operacje są intuicyjne, to ich przełożenie na dwuwymiarową siatkę komórek – niekoniecznie.

Po raz kolejny przekonujemy się, że oddzielenie danych od operacji na danych bardzo ułatwia śledzenie przebiegu obliczeń. Ani przez chwilę nie zaprzątamy sobie głowy rozmieszczeniem kolejnych etapów obliczeń we wspólnym układzie współrzędnych, jak muszą to robić użytkownicy Excela.

Kategorie
Analiza danych Zrób to sam

Analiza danych w języku R – odcinek 8

Dziś wracamy do ramek danych i uczymy się tworzyć oraz usuwać kolumny i wiersze. Najpierw jednak przyjrzymy się operatorowi, z którego do tej pory korzystaliśmy bez głębszego zastanowienia.

Kategorie
Zrób to sam

SelfPIe printer czyli moja fotobudka z 2014 roku

Dziesięć lat temu zbudowałem fotobudkę. Obecnie jej funkcjonalny odpowiednik można kupić w sieci piętnaście razy taniej, niż wynosił koszt mojego prototypu. I to jest świetna wiadomość, bo zabawa jest dziś taka sama a nawet lepsza!

OK, moja rzemieślnicza fotobudka nie była budką tylko raczej fotopudełkiem. Zdjęcia drukowała na rolkach papieru termicznego, używanych powszechnie w kasach fiskalnych. Dziś opowiadam o projekcie, sprawdzam, ile jego realizacja kosztowałaby dzisiaj, i zdaję relację z zabawy chińskim zamiennikiem.

Kategorie
Analiza danych Zrób to sam

Analiza danych w języku R – odcinek 7

W pierwotnym planie wydawniczym Poradnika dla sponiewieranych Excelem, dzisiejszy odcinek miał traktować o dodawaniu oraz usuwaniu wierszy i kolumn w ramce danych. Na szczęście mogę ów plan spontanicznie modyfikować, więc dziś będzie o… gimbazie.

Do gimnazjów uczęszczały roczniki 1986-2003. Najmłodsi absolwenci mają dziś ponad dwadzieścia lat. Za dwadzieścia lat dobiją do czterdziestki. Zastanowiłem się, jak ich podróż w przyszłość będzie wyglądała na wizualizacji piramidy wieku mieszkańców Polski. Obserwatorzy social mediów Informatyka Zakładowego już to wiedzą:

Kategorie
Analiza danych Zrób to sam

Analiza danych w języku R – odcinek 6

W pracy z danymi można wyróżnić kilka etapów. Pierwszym jest import danych, omówiliśmy go pobieżnie w odcinku czwartym. Ostatnim będzie analiza i wyciąganie wniosków. Etap pośredni to dostosowanie załadowanych danych do postaci najbardziej dogodnej do przetwarzania – tym tematem zajmiemy się dzisiaj.

Bardzo rzadko kontrolujemy format i „kształt” danych wejściowych. Najczęściej dostaniemy na twarz zestaw plików CSV albo XLSX o losowym układzie i przypadkowym nazewnictwie kolumn. Dla początkujących analityków będzie to dużą niespodzianką, ale w projektach Data Science nierzadko 80% czasu spędzimy na… konwersji i łączeniu danych z różnych źródeł.

Kategorie
Publicystyka Wywiad

Jacek Krywko: nadal istnieją ludzie, którym zależy na treściach dobrej jakości

Niech to wybrzmi na samym początku: jestem wielkim fanem serwisu Ars Technica. Gdybym na bezludną wyspę mógł zabrać tylko jednego RSS-a, wybrałbym Ars Technikę. Gdybym miał zainteresowanym branżą IT polecić tylko jedno źródło wiedzy, byłaby to Ars Technica. Od lat płacę za subskrypcję – tylko po to, by wspierać istnienie serwisu, bo przecież każdy może go czytać za darmo.

Gdy więc zauważyłem na łamach autora o polskim nazwisku, postanowiłem podpytać o kulisy pracy w tak prestiżowym tytule. Jacek Krywko był dziennikarzem Gazety Wyborczej, obecnie pracę redaktora łączy z pisaniem tekstów i koordynacją projektów dla branży kosmicznej w firmie Zortrax. Dzisiejszą rozmowę zaczęliśmy od zakrętów, którymi dotarł do Ars Techniki, ale szybko doszliśmy do wyzwań i problemów stojących przed redakcjami serwisów piszących o nowoczesnych technologiach.

Kategorie
Porady Zrób to sam

Wyposażenie mojej pracowni 2024

Niniejszy tekst jest kontynuacją oraz rozwinięciem artykułu z marca 2023, w którym opisywałem wyposażenie domowego stanowiska pracy i zabawy. Warto tam zajrzeć, bo nie wszystkie sprzęty powracają w tym odcinku.

Pracuję z domu a pokój do pracy jest jednocześnie pokojem rekreacji. Wiele urządzeń ma więc podwójną rolę – w godzinach biurowych mają usprawniać pracę, wieczorami zaś przydają się do tworzenia prywatnych projektów, majsterkowania czy grania w gry. Opisuję, jak oceniam posiadane akcesoria po dłuższym okresie oraz co i dlaczego zmieniło się w używanej konfiguracji sprzętowej.

Kategorie
Publicystyka

Projekt Drawboard czyli aplet Javy 20 lat później

Dla was, czytelników, niniejszy artykuł będzie jedynie historyczną ciekawostką. Dla mnie, autora, ładunkiem nostalgii uderzającym z impetem 16-tonowego odważnika. Proszę wybaczyć nadmiar wzruszeń, ale nie co dzień mamy okazję uruchomić po 20 latach swój program i przekonać się, że wszystko działa od pierwszego strzału. No, prawie.

Aplikację Drawboard, o której chcę wam dziś opowiedzieć, rozwijałem w latach 2001-2004, zaś ostatnia wersja została opublikowana dokładnie dwadzieścia lat i dzień temu, siódmego sierpnia 2004. Był to jeden z moich pierwszych porządnych programów i stanowił chyba jedyny przypadek, gdy zarobiłem pieniądze na otwartym oprogramowaniu.

Kategorie
Analiza danych Zrób to sam

Analiza danych w języku R – odcinek 5

Uczestników e-mailowej edycji „Poradnika” pytałem, czego najbardziej nie lubią w pracy z Excelem. Wśród odpowiedzi bardzo często pojawiały się daty i obliczenia kalendarzowe. Oto jeden z typowych cytatów: „Praca z datami i timestampami. To jest koszmar i jedna wielka patologia, szczególnie w połączeniu z wykresami i to jeszcze przeklejanymi do prezentacji. Jeśli miałbym wskazać jedną, absolutnie najgorszą rzecz, to to by było to. Aż się zdenerwowałem na samą myśl.

Trzeba przyznać, że Excel zasłużył sobie na krytykę – jego nadgorliwość w konwersji wszystkiego na daty jest co najmniej irytująca. Ważniejsze problemy leżą jednak głębiej, w sposobie reprezentacji dat i godzin oraz operowania na nich.

Kategorie
Analiza danych Zrób to sam

Analiza danych w języku R – odcinek 4

W poprzednich odcinkach nauczyliśmy się, jak tworzyć ramkę danych z pliku CSV i jak wizualizować dane na wykresach. Co jednak, jeśli chcemy eksperymentować na własnych danych, które trzymamy w Excelu? Nie musimy używać formatów pośrednich – dziś utworzymy ramkę danych bezpośrednio z pliku XLSX.