fbpx
Kategorie
Publicystyka Statystyki

Podsumowanie piątego roku blogowania

Dziwny był to rok, w którym ostatecznie zaakceptowałem mądrość, że to droga jest celem. Do przeszłości należy złość, że artykuł, w który włożyłem dużo wysiłku, nie klika się. Przestałem śledzić statystyki bloga i oceniać potencjalne tematy pod kątem oglądalności. Piszę, bo lubię. Osiągnąłem zen, homeostazę, homeopatię i osteoporozę. A jedno zdanie z tego akapitu nie jest do końca prawdziwe.

Samo zaś pojęcie bloga robi się tak archaiczne, że młodzieży będę się chyba przedstawiał jako „tekstowy influencer”. A gdy dodam, że mojej twórczości nie wspomaga AI, to już całkiem wyjdę na cyfrowego amisza. I tak to się pomalutku toczy w tej blogosferze…

Kategorie
Analiza danych Zrób to sam

Analiza danych w języku R – epilog

To ostatni odcinek Poradnika dla Sponiewieranych Excelem. Niesie on radość wszystkim, którzy chcieli używać pakietu RStudio w pracy, ale dowiedzieli się, że nie zostanie on zainstalowany (nie, bo nie i kropka).

Jeśli masz dostęp do internetu, do twojej dyspozycji pozostają co najmniej dwa sposoby uruchomienia kodu R w… przeglądarce internetowej. Choć praca może nie być tak wygodna i wydajna, jak w natywnym RStudio zainstalowanym na komputerze, to dla wielu osób może być to wariant dostatecznie dobry.

Kategorie
Publicystyka Zrób to sam

Zainstaluj chińskiego czata na swoim komputerze

Gdy siadam do pisania tego tekstu, kurs akcji NVidii – najwyżej wycenianej firmy świata – spadł o 17%, co oznacza, że w kilkanaście godzin łączna wartość firmy zmniejszyła mniej-więcej o cztery roczne budżety Polski. A wszystko z powodu Dużego Modelu Językowego (LLM) chińskiej produkcji o nazwie DeepSeek R1. Zainstalujemy go dziś na naszym komputerze.

Tylko… czy instalowanie chińskiego oprogramowania będzie bezpieczne? Każdy z nas bawił się ChatemGPT, ale w jego przypadku korzystamy z przeglądarki internetowej a serwery zlokalizowane są w USA. To zupełnie inna sytuacja, niż uruchamianie czegoś lokalnie na własnej maszynie – szczególnie, gdy mowa o produkcie z Chin, państwa totalitarnego, inwigilującego obywateli i trzymającego rodzime firmy technologiczne na krótkiej smyczy.

Kategorie
Analiza danych Zrób to sam

Analiza danych w języku R – odcinek 12

W poprzednim odcinku Poradnika dla sponiewieranych Excelem wyraziłem opinię, że Główna Dyrekcja Dróg Krajowych i Autostrad powinna tworzyć takie prezentacje własnymi siłami, nie zaś zlecać ich produkcję na zewnątrz.

Dziś sprawdzimy, ile pracy wymagałoby stworzenie kompleksowego raportu z danych zebranych przez Stacje Ciągłych Pomiarów Ruchu, ale dla każdej stacji z osobna. Skorzystamy ponownie z zestawu danych udostępnionego w serwisie dane.gov.pl.

Kategorie
Administracja publiczna

Realny i najwyższy stopień zagrożenia

Zamknijcie oczy i wyobraźcie sobie realny i najwyższy stopień zagrożenia infrastruktury teleinformatycznej państwa. Co widzicie? Telekomy rzucone na kolana przez ransomware? Płonące serwerownie platformy ePUAP? Agencję Wywiadu zinfiltrowaną przez wrogów? Ujawnione sekrety NATO? No to się zdziwicie.

W opinii niektórych urzędników, bardziej niszczycielskie skutki miałoby… udostępnienie kodu źródłowego Systemu Losowego Przydziału Spraw. Przecieracie oczy z zaskoczenia? Ja, podczas lektury pisma z Ministerstwa Sprawiedliwości, miałem ochotę je sobie wydłubać.

Kategorie
Zrób to sam

Pogodynka zrób-to-sam

Każdy głupi może kupić gotową stację meteo z prognozą ściąganą z internetu. Co innego budowa własnej, droższej – z tym poradzi sobie nie każdy głupi. Mi się udało.

W niniejszym artykule opisuję plany, z jakimi przystąpiłem do realizacji autorskiego projektu, oraz rezultaty, które osiągnąłem przy użyciu płytki Pimoroni Badger 2040W z wyświetlaczem typu e-papier. W ramach dygresji przybliżam świat mikrokontrolerów i wskazuję, że nawet proste ich zastosowania ucząc bawią i bawiąc uczą.

Kategorie
Analiza danych Zrób to sam

Analiza danych w języku R – odcinek 11

Łączenie danych z dwóch różnych źródeł przy użyciu funkcji WYSZUKAJ.PIONOWO albo X.WYSZUKAJ (czyli VLOOKUP/XLOOKUP) to w Excelu swoisty rytuał przejścia. Oddziela on użytkowników początkujących od średnio zaawansowanych. 

Wyszukiwanie wg klucza jest w Excelu nierozerwalnie związane ze wspólnym układem współrzędnych. Podajemy zakresy danych dla kluczy, zakresy danych dla rezultatów, preferowany tryb dopasowania danych – przy większych zbiorach danych staje się to naprawdę niewygodne. 

Ramki danych języka R pozwalają wiele operacji przeprowadzić w sposób szybszy i czytelniejszy. Tak też będzie dzisiaj – poznamy trzy różne sposoby na łączenie informacji z różnych zestawów danych.

Kategorie
Analiza danych Zrób to sam

Analiza danych w języku R – odcinek 10

Gdy przetwarzamy dane pomiarowe zebrane w tzw. szeregach czasowych (seria pomiarów wraz z datą wykonania), możemy potrzebować informacji na temat długoterminowej dynamiki zmian. Czasem nie będzie ona oczywista, bo np. temperatura powietrza może zmieniać się w ciągu doby o 20 stopni Celsjusza a tygodniowy trend niekoniecznie ukaże się na wykresie.

W innych sytuacjach przydatne będą obliczenia przyrostowe, np. liczba sprzedanych egzemplarzy towaru od początku roku kalendarzowego albo średnia wszystkich dotychczasowych ocen wskazanego ucznia. Jak sobie z tym poradzić?

Dziś poznamy funkcje przydatne podczas analizowania szeregów czasowych

Kategorie
Publicystyka

Kalkulator Commodore Minuteman 6X

W wielu rodzinach odnajdziemy artefakty przekazywane z ojca na syna. Zazwyczaj będą to mało unikalne „przydasie”, jak klucz francuski czy kable rozruchowe do auta, ale czasem znajdzie się wśród nich prawdziwa perełka.

Przykładem takiego skarbu może być kalkulator Commodore Minuteman 6X, który spędził w mojej rodzinie jakieś 40 lat. Tacie podarował go prawdziwy wujek z USA! Dopiero dobrą dekadę później połączyłem kropki i zorientowałem się, że producentem urządzenia jest firma odpowiedzialna za wprowadzenie na rynek nieśmiertelnego Commodore 64 a potem szesnastobitowców z serii Amiga.

Kategorie
Analiza danych Zrób to sam

Analiza danych w języku R – odcinek 9

W dziewiątym odcinku Poradnika dotarliśmy do obliczeń agregujących. Wielu użytkowników Excela zostało tu solidnie sponiewieranych, bo choć same operacje są intuicyjne, to ich przełożenie na dwuwymiarową siatkę komórek – niekoniecznie.

Po raz kolejny przekonujemy się, że oddzielenie danych od operacji na danych bardzo ułatwia śledzenie przebiegu obliczeń. Ani przez chwilę nie zaprzątamy sobie głowy rozmieszczeniem kolejnych etapów obliczeń we wspólnym układzie współrzędnych, jak muszą to robić użytkownicy Excela.