Kategorie
Publicystyka

Emotikonki, Unicode, kodowanie znak贸w, bezpiecze艅stwo, 馃樂馃

Dzi艣 temat l偶ejszy, bo ci臋偶sze i tak wr贸c膮 same. Na tapet臋 bierzemy ma艂e obrazeczki wstawiane do wypowiedzi pisemnych, nazywane emoji (s膮 z Japo艅czykami od roku 1999) albo emotikonkami (w formie graficznej s膮 z ca艂膮 reszt膮 艣wiata od鈥 oko艂o 1996 roku, licz膮c od premiery komunikatora ICQ). Pury艣ci oburz膮 si臋, 偶e to przecie偶 co innego bo etymologia, tradycja i nie o take ikone walczyli艣my, ale c贸偶, dzi艣 emotka to emotka.

Ot贸偶, jak informuje serwis emojipedia.org, 艣wiatow膮 karier臋 robi膮 teraz ikonki 馃樂 (twarz w maseczce ochronnej) oraz 馃 (mikrob) – wywo艂ane oczywi艣cie epidemi膮 koronawirusa wywo艂uj膮cego chorob臋 COVID-19. Poni偶ej wykres ogl膮dalno艣ci stron 馃樂, 馃 oraz 馃 w Emojipedii.

Uwaga!

Na niekt贸rych urz膮dzeniach (zw艂aszcza starszych telefonach) mo偶esz do艣wiadczy膰 problem贸w w czytaniu tego tekstu, wynikaj膮cych z braku obs艂ugi nowszych emotikonek. W takiej sytuacji przesi膮d藕 si臋 na komputer z aktualnym Firefoksem lub Chrome

O popularno艣ci emotikonek/emoji nie trzeba nikogo przekonywa膰 – ociekaj膮 nimi Twitter, Instagram i reszta sieci spo艂eczno艣ciowych. Ba, nawet babcie 馃懙, kt贸re kilka(na艣cie) lat temu uczy艂y si臋 obs艂ugi SMS-贸w 馃摫馃摐, teraz bez wahania uzupe艂niaj膮 je okoliczno艣ciowym ikonkami u艣mieszk贸w 馃グ czy zwierz膮tek 馃悎.

Nie b臋d臋 rozpisywa艂 si臋 o socjologicznym aspekcie przekazywania emocji kana艂ami tekstowymi, to w ko艅cu blog technologiczny. Zastan贸wmy si臋 raczej, ile mamy r贸偶nych emoji. Ot贸偶 w 艣wie偶utkim (marzec 2020) standardzie Emoji 13, nieprzypadkowo skorelowanym z Unicode 13, mamy a偶 3304 unikalne obrazki. Tak du偶a liczba wynika po cz臋艣ci z faktu, 偶e wiele ikonek wyst臋puje w sze艣ciu kopiach.

Oczywi艣cie znaczna wi臋kszo艣膰 to nadal unikalne obrazeczki a ka偶dy inny

Wiele os贸b mo偶e by膰 zaskoczonych, 偶e w r贸偶nych programach i systemach operacyjnych mamy dost臋p do r贸偶nych zestaw贸w ikonek, wygl膮daj膮cych inaczej lecz bazuj膮cych na tym samym tekstowym opisie. Liczba zestaw贸w powoli maleje, bo nie wszyscy tw贸rcy dodaj膮 nowe cechy i obrazki z kolejnych edycji standardu. Wci膮偶 jednak mo偶na spotka膰 kilkana艣cie zestaw贸w, oto przyk艂ady naszych dzisiejszych emoji w siedmiu najpopularniejszych uj臋ciach:

A tak prezentuje si臋 przyk艂adowy zestaw ikonek z Whatsappa (tutaj du偶a wersja, uwaga bo ma 10 MB)

Bardzo du偶a swoboda w kreacji obrazk贸w prowadzi czasem do zaskakuj膮cych obserwacji, na przyk艂ad w poni偶szym przezabawnym w膮tku na Twitterze planetolog z NASA ocenia zgodno艣膰 emoji Saturna z prawdziwym wizerunkiem tej planety (wygra艂 Whatsapp)

Sk膮d taka popularno艣膰 emoji?

W 艣redniowieczu ozdobne inicja艂y na pocz膮tku karty lub rozdzia艂u wymaga艂y znacznie wi臋kszego nak艂adu pracy, ni偶 tekst kaligrafowany wok贸艂 nich. Podobnie jest z mieszaniem tekstu i grafiki w oprogramowaniu. Do ko艅ca poprzedniej dekady w graficznych interfejsach u偶ytkownika blok tekstu musia艂 by膰 jednorodny i sk艂ada膰 si臋 ze znak贸w tego samego rozmiaru pochodz膮cych z jednego kroju.

Gdy jaki艣 czas p贸藕niej mo偶liwe sta艂o si臋 mieszanie r贸偶nych rozmiar贸w i kroj贸w, cz臋sto wplatano w tekst czarno-bia艂e piktogramy z fontu Windings.

Autorzy takich komunikator贸w, jak ICQ czy rodzime Gadu-Gadu, musieli pokona膰 sporo przeszk贸d, by wstawi膰 w tekst kolorowe obrazki (cz臋sto animowane). Jeszcze wi臋cej problem贸w mieli autorzy multikomunikator贸w, wymar艂ej ga艂臋zi program贸w obs艂uguj膮cych kilka protoko艂贸w naraz, bo musieli znale藕膰 spos贸b na t艂umaczenie autorskich oznacze艅 emotek mi臋dzy r贸偶nymi standardami i sensownie obs艂u偶y膰 brak bezpo艣rednich odpowiednik贸w. W dzisiejszych czasach, gdy interfejsy program贸w u偶ytkowych cz臋sto wy艣wietlane s膮 z u偶yciem technologii wywodz膮cych si臋 z przegl膮darek WWW, wy艣wietlanie emotikonek sta艂o si臋 jednak 艣miesznie proste. Zawdzi臋czamy to standardowi Unicode.

Strony kodowe a Unicode

Pierwsze komputery wczytywa艂y dane i programy z ta艣m perforowanych lub dziurkowanych kartonik贸w. Wyniki by艂y wypisywane na drukarkach wywodz膮cych si臋 z dalekopis贸w. Przypisanie liczb – warto艣ci bajt贸w – do liter i cyfr mog艂o by膰 dowolne, dop贸ki zgadza艂o si臋 w obu urz膮dzeniach. Obowi膮zuj膮cy do dzi艣 standard ASCII (na obrazku powy偶ej) jest w u偶yciu od wczesnych lat 鈥60 ubieg艂ego wieku i uwzgl臋dnia wszystkie litery alfabetu 艂aci艅skiego, jednak brakuje w nim literek ze znakami diakrytycznymi, czyli w wariantach z ogonkami, kropkami, kreskami i tak dalej.

Pomin臋 tu opis metod radzenia sobie z tym problemem, niekt贸re by艂y proste, inne bardziej zaawansowane, jednak dopiero pe艂ne wdro偶enie standardu Unicode w systemach operacyjnych i programach u偶ytkowych ostatecznie wyzwoli艂o programist贸w i u偶ytkownik贸w z troski o to, czy jaki艣 napis da si臋 przedstawi膰 na ekranie.

Dygresja – je艣li siedzisz w IT i czujesz, 偶e ta wiedza b臋dzie ci potrzebna (a b臋dzie!), to mo偶esz zacz膮膰 od tego artyku艂u z roku 2003, napisanego przez Joela Spolsky鈥檈go, blogera bardzo popularnego w pocz膮tkach tysi膮clecia. Zapami臋taj to nazwisko, bo po pierwsze gdy umiesz zacytowa膰 Spolsky鈥檈go to troch臋 tak, jakby艣 umia艂(a) zacytowa膰 Bu艂hakowa, a po drugie Joel to wsp贸艂za艂o偶yciel StackOverflow, wi臋c w odpowiednim towarzystwie zab艂y艣niesz jeszcze bardziej. A po trzecie, hehe, Joel z Polski, nie? Koniec dygresji.

Unicode (Unikod) to taki spos贸b zapisu znak贸w, w kt贸rym zmie艣ci si臋 ponad milion znak贸w. Do dzi艣 zdefiniowano przypisania dla 154 wsp贸艂czesnych i historycznych alfabet贸w, w艣r贸d nich m.in. koptyjski, mongolski, khmerski czy hieroglificzny.

Mamy tam te偶 wiele innych symboli i piktogram贸w, m.in. nuty, symbole matematyczne, symbole walut oraz鈥 emotikonki. Mimo to liczba zdefiniowanych znak贸w to dopiero 143 tysi膮ce, wi臋c rezerw starczy nam jeszcze na d艂ugo.

Jak wcze艣niej wspomnia艂em, liczba emotikonek uros艂a znacz膮co z powodu postaci i buziek powielanych z r贸偶nymi kolorami sk贸ry. Poszanowanie dla odmienno艣ci ma znaczenie, ale czy nie 偶al marnowa膰 numeracji dzi艣, gdy mo偶e zabrakn膮膰 jej pojutrze?

Chytr膮 sztuczk膮 czyli a+鈼屘

A jednak niczego nie marnujemy! Najpierw ma艂e wyja艣nienie, opisuj膮ce mechanizm kompozycji grafem贸w. Przyjrzyjmy si臋 ma艂ej literce 鈥鈥 zdefiniowanej w tablicach Unicode pod numerem 261 (szesnastkowo 0x105) jako 鈥Latin Small Letter A with Ogonek鈥.

Zauwa偶amy, 偶e jest ona zdefiniowana jako po艂膮czenie znak贸w 鈥a鈥 (nr 97, Latin Small Letter A) oraz 鈥鈼屘鈥 (nr 808, Combining Ogonek). W Unicode mo偶emy wi臋c zapisa膰 鈥鈥 jako jeden znak 261 lub par臋 znak贸w 97 i 808, za艣 na ekranie i wydruku oba te warianty b臋d膮 r贸wnowa偶ne.

Przy okazji – s艂owo 鈥渮nak鈥 mo偶e oznacza膰 r贸偶ne rzeczy w zale偶no艣ci od kontekstu, jednak pe艂na terminologia (code point, code unit, grafem, glif) jest nieco uci膮偶liwa a niniejszy tekst i tak oparty jest na pewnych uproszczeniach wi臋c zostawiam jak jest.

inny przyk艂ad kompozycji znaku
藕r贸d艂o: https://blog.emojipedia.org/unicode-behind-the-curtain/

Trik z 艂膮czeniem wielu kod贸w wykorzystano w licznych emoji, tak偶e tych z wariantami koloru sk贸ry. Emotka 馃懆馃徑 (m臋偶czyzna z jasnobr膮zow膮 sk贸r膮) to sekwencja kod贸w 馃懆 (m臋偶czyzna) z nast臋puj膮cym bezpo艣rednio po nim kodem 馃徑 (jasnobr膮zowa sk贸ra). W edytorze Google Docs mo偶na przekona膰 si臋 o tym, wklejaj膮c znak 馃懆馃徑 i wciskaj膮c klawisz usuwania znaku. Pierwsze wci艣ni臋cie klawisza skasuje niewidoczny kod 馃徑, wi臋c ikonka zmieni si臋 w 馃懆. T臋 usunie dopiero drugie u偶ycie klawisza.

Nie ma wi臋c mowy o 偶adnym marnotrawstwie – gdy kolejna wersja standardu Emoji wprowadza warianty sk贸ry dla istniej膮cej ikonki, nie potrzebujemy nowych znak贸w Unicode, wystarcz膮 nam te ju偶 zdefiniowane. Zachowujemy jednocze艣nie zgodno艣膰 wsteczn膮 – gdy na tak膮 sekwencj臋 trafi program, kt贸ry wy艣wietla Unicode 8 ale nie zna definicji standardu Emoji 2.0, zamiast 鈥滒煈煆解 wy艣wietli 鈥滒煈 馃徑鈥.

ZWJ – niewidoczny bohater

Szczeg贸lne znaczenie dla standardu Emoji ma znak o kodzie 0x200d – ZERO WIDTH JOINER czyli 艂膮cznik zerowej szeroko艣ci. Jest to niewidoczny znak steruj膮cy, kt贸ry wyst臋puje w wielu definicjach emotikonek kompozytowych. Przyk艂ad: 馃懆鈥嶐煈┾嶐煈︹嶐煈 czyli rodzina z dw贸jk膮 ch艂opc贸w. Sk艂ada si臋 z ikonek 馃懆馃懇馃懄馃懄 pomi臋dzy kt贸rymi umieszczono trzy znaki ZWJ.

S艂abo? To teraz uwa偶ajcie – 鈥渞odzina鈥 w emoji mo偶e si臋 sk艂ada膰 z jednego lub dw贸ch rodzic贸w (tak偶e tej samej p艂ci) i jednego lub dw贸jki dzieci 馃懇馃徏鈥嶐煈煆尖嶐煈ю煆尖嶐煈ю煆 (z kt贸rych jedno mo偶e by膰 bezp艂ciowym oseskiem). Na tym etapie mamy 54 warianty w kt贸rych pojawia si臋 178 postaci, co uwzgl臋dniaj膮c dowolno艣膰 kolor贸w sk贸ry u cz艂onk贸w rodziny daje ponad 1000 kombinacji

Kolory sk贸ry to modyfikator niemal 300 emoji i w wielu sytuacjach zwielokrotnia inne kombinacje, np. par臋 trzymaj膮c膮 si臋 za r臋ce lub postacie wykonuj膮ce r贸偶ne zawody (w wariantach m臋偶czyzna / kobieta / osoba).

Design systems

Microsoft ju偶 w roku 2016 informowa艂, 偶e wprowadzi艂 do Windows 10 wsparcie wszystkich mo偶liwych zestaw贸w modyfikator贸w, wskutek czego liczba mo偶liwych do obs艂u偶enia emotek si臋gn臋艂a a偶 52 tysi臋cy.

Tak wielka liczba ilustracji wyklucza mo偶liwo艣膰 ich r臋cznego przygotowania. Zespo艂y grafik贸w pracuj膮cych nad emoji zacz臋艂y korzysta膰 z tzw. design system贸w, czyli (w uproszczeniu) zestawu wytycznych, wzorc贸w i szablon贸w, dzi臋ki kt贸rym zmiany i korekty mog膮 by膰 nanoszone jednocze艣nie na setki i tysi膮ce obrazk贸w, za艣 nowo tworzone obrazki zachowuj膮 sp贸jno艣膰 stylistyczn膮 z poprzednikami.

Przyk艂ady takiego design systemu mo偶na znale藕膰 na blogu Google, oto np. te same elementy mimiki u偶ywane s膮 w r贸偶nych emotkach, nawet pochodz膮cych z r贸偶nych grup:

Projektowanie ikonek nie jest proste, bo i liczba wymaga艅 przed nimi stawianych jest d艂uga. Musz膮 by膰 przede wszystkim estetyczne, 艂adnie wygl膮da膰 po powi臋kszeniu. Jednocze艣nie powinny da膰 si臋 rozr贸偶nia膰 tak偶e wtedy, gdy b臋d膮 rysowane w kwadracie o boku kilkunastu pikseli. Kraw臋d藕 musi zapewni膰 odpowiedni膮 widoczno艣膰 na tle o ka偶dym kolorze, co jest wyzwaniem, bo jak pokaza膰 na czarnym tle czarnego kota albo czarne serce?

Czy spe艂nienie takich wymaga膰 jest w og贸le mo偶liwe? R贸偶nie bywa. Na poni偶szym obrazku widzimy studentk臋 o kremowej sk贸rze, po lewej stronie obrazki Apple, Google i Microsoftu, po prawej czterokrotnie powi臋kszone przyk艂ady u偶ycia z systemu Windows: nag艂贸wek strony z Emojipedii (26 pikseli szeroko艣ci), nag艂贸wek karty w Firefoksie (12 pikseli) oraz tytu艂 strony w pasku zada艅 (9 pikseli, czer艅 i biel). Dwa ostatnie przyk艂ady s膮 ju偶 ca艂kowicie nieczytelne – a i tak m贸wimy o emotkach Microsoftu, kt贸re dzi臋ki prostej geometrii i kontrastowym kolorom bardzo dobrze znosz膮 pomniejszanie.

Bezpiecze艅stwo emotikonek (i Unicode)

Do tej pory mowa by艂a o nowych, fajnych i zaskakuj膮cych mo偶liwo艣ciach, jakie przynios艂o ustandaryzowanie Emoji na bazie kolejnych edycji zestawu znak贸w Unicode. Od strony programistycznej nie wszystko wygl膮da r贸偶owo.

Pierwsze problemy pojawiaj膮 si臋 w przypadku starszych j臋zyk贸w programowania, kt贸re cz臋sto powsta艂y kilkadziesi膮t lat temu a s膮 u偶ywane do dzi艣 (jak C i C++) – tam obs艂uga napis贸w uwzgl臋dniaj膮cych Emoji/Unicode wymaga u偶ycia dodatkowych bibliotek, za艣 wi臋kszo艣膰 funkcji operuj膮cych na 艂a艅cuchach znak贸w traci zastosowanie.

Tak偶e edytory kodu 藕r贸d艂owego i fonty tam u偶ywane cz臋sto renderuj膮 tylko niewielki podzbi贸r najcz臋艣ciej u偶ywanych znak贸w Unicode. To na szcz臋艣cie mniejszy problem, bo napisy z emotkami rzadko pojawiaj膮 si臋 w kodzie 藕r贸d艂owym – zazwyczaj s膮 umieszczone w osobnych plikach z zasobami. Gorzej, gdy przy okazji kopiowania i wklejania do kodu 藕r贸d艂owego za艂api膮 si臋 jakie艣 niewidoczne znaki steruj膮ce – mog膮 by膰 one przyczyn膮 egzotycznych, trudnych do naprawienia b艂臋d贸w.

Znacz膮cym problemem mo偶e by膰 rozmiar reprezentacji tekst贸w Unicode w pami臋ci komputera. Przyjmijmy, 偶e kto艣 w formularzu na stronie WWW wstawi w nazwie u偶ytkownika znaki 馃懆馃徎鈥嶐煈煆烩嶐煈ю煆烩嶐煈ю煆 (rodzina z dwiema dziewczynkami, jasny kolor sk贸ry). Zale偶nie od tego, jakiej funkcji u偶yjemy, d艂ugo艣膰 takiego tekstu mo偶e by膰 zdefiniowana jako 1 (jeden znak graficzny), 4 (cztery postacie sk艂adowe), 7 (cztery postacie plus trzy 艂膮czniki zerowej szeroko艣ci), 11 znak贸w (jak wy偶ej ale ka偶da posta膰 dodatkowo z kolorem sk贸ry) lub鈥 38 (liczba bajt贸w do zapisania tej sekwencji w UTF-16). Bez problemu mo偶emy jednak skonstruowa膰 r贸wnowa偶ne sekwencje koduj膮ce symbol 馃懆馃徎鈥嶐煈煆烩嶐煈ю煆烩嶐煈ю煆 o d艂ugo艣ci 40, 42 albo 44 bajt贸w.

Je艣li teraz tekst 鈥滒煈煆烩嶐煈煆烩嶐煈ю煆烩嶐煈ю煆火煈煆烩嶐煈煆烩嶐煈ю煆烩嶐煈ю煆火煈煆烩嶐煈煆烩嶐煈ю煆烩嶐煈ю煆火煈煆烩嶐煈煆烩嶐煈ю煆烩嶐煈ю煆烩 zostanie zapisany w bazie danych, w kt贸rej na login przewidziano sta艂膮 liczb臋 bajt贸w (a funkcja weryfikuj膮ca d艂ugo艣膰 tekstu mierzy艂a znaki graficzne zamiast bajt贸w), mamy spor膮 szans臋 na to, 偶e zapis zostanie uci臋ty w losowym miejscu. Sko艅czymy z nazw膮 u偶ytkownika, w kt贸rej niekompletna b臋dzie albo sekwencja, albo wr臋cz kt贸ry艣 ze znak贸w sk艂adowych. Zale偶nie od j臋zyka, frameworka, 艣rodowiska, bazy danych i przegl膮darki, efektem mo偶e by膰 kosmetyczna niedogodno艣膰 jak i za艂amanie pracy systemu.

鈥滒煈煆烩嶐煈煆烩嶐煈ю煆烩嶐煈ю煆烩 mo偶e by膰 i tak 艂atwiejszy do obs艂u偶enia, ni偶 t潭虝虣毯e谈蛯太k痰虒虄贪s檀虤虂瘫泰t潭蛯蜅蛧苔 潭蛫蛽h潭探蛫贪态o谭虈虦蛶j潭蛼虖泰n潭蛡蜖虧i谭蜆太贪e潭虘蜁虡 潭蛦蜁o檀虋虙虦獭p谭蛢蜄蛧a谭蛠虂虣汰t痰虄蛵毯r谭虂泰虠z檀虜坦o痰虝毯n痰蜖蛺坦虠y谭虃蛬虦 谭虃蛥蜏a谈虁虜蛥k谈蛣蜏胎c谈虝蛦虠e痰虅炭虪n谈蛣處挞踏t谭虋贪a谭蛠虠m檀虉虡挞i痰虖炭蛿 (tekst hojnie opatrzony akcentami, wygenerowany tym narz臋dziem), kt贸ry zamiast 32 znak贸w ma ich 艂膮cznie a偶 160. Narz臋dzie wspomagaj膮ce liczenie znajdziesz tutaj za艣 tutaj jest fajny opis, dlaczego emotka 馃う鈥嶁檪锔 ma w r贸偶nych reprezentacjach i metodach pomiaru rozmiary 1, 2, 3, 5, 7, 14, 17 oraz 20.

O wielu innych ciekawostkach mo偶na poczyta膰 tutaj – na dole strony znajduj膮 si臋 slajdy prezentuj膮ce wiele niespodziewanych sytuacji, na jakie mo偶e natrafi膰 programista (a i tak opisano tylko przygody z jednym j臋zykiem programowania).

Prawdziwe problemy z bezpiecze艅stwem pojawiaj膮 si臋 jednak wtedy, gdy atakuj膮cy doprowadzi atakowany system do nieprzewidzianego stanu a potem wykorzysta ujawnione w ten spos贸b usterki.

Przyk艂ad z 偶ycia w tym tweecie:

Dzi臋ki temu, 偶e pewien znak Unicode by艂 przez atakowany system zamieniany na 鈥滐拷鈥 za艣 ten – na 鈥?鈥, atakuj膮cy zyska艂 mo偶liwo艣膰 przekierowania u偶ytkownik贸w systemu do podstawionej witryny na swoim serwerze.

Inna sztuczka z Unicode to mieszanie tekst贸w czytanych od lewej do prawej (LTR) z tekstami czytanymi od prawej do lewej (RTL) – dzi臋ki temu atakuj膮cy mo偶e przekona膰 u偶ytkownika, 偶e podlinkowany dokument o nazwie EXE.TEST.DOC to plik Worda, gdy tymczasem plik nosi rzeczywist膮 nazw臋 COD.TSET.EXE i zawiera z艂o艣liwy program wykonywalny.

Je艣li atakowany system sprawdza lub filtruje cyfry lub liczby, to przemycenie warto艣ci numerycznych mo偶e nam si臋 uda膰 przy u偶yciu jednej z sze艣ciuset dwudziestu alternatywnych cyferek, np. , , czy .

Temat bezpiecze艅stwa i Unicode wype艂ni艂by niejedn膮 ksi膮偶k臋, wi臋c tu przerw臋 i zach臋c臋 ci臋 do w艂asnor臋cznego szukania informacji na ten temat – mo偶esz zacz膮膰 od opisu niedawno odkrytego b艂臋du, wskutek kt贸rego GitHub wysy艂a艂 mail z linkiem do resetowania has艂a na niew艂a艣ciwy adres.

Emotikonki i polityka

Temat sprzed kilku miesi臋cy: je艣li w swoim iPhone przestawisz ustawienia regionalne na chi艅skie, iOS przestanie wy艣wietla膰 flag臋 Tajwanu. Je艣li zmienisz ustawienia na Hongkong, flag臋 t臋 b臋dzie si臋 da艂o wy艣wietli膰 ale na li艣cie Emoji jej nie znajdziesz.

To tylko jeden z przyk艂ad贸w, gdy wielkie korporacje podlizuj膮 si臋 mocarstwom – Google i Apple pokazuj膮 Krym jako terytorium Rosji, je艣li u偶ywasz map Google/Apple w Rosji. Dla u偶ytkownik贸w 艂膮cz膮cych si臋 z reszty 艣wiata Krym jest raczej ukrai艅ski, ale te偶 tak nie do ko艅ca, bo z wy艣wietlaniem granic bywa r贸偶nie.

Ciekawostki i inne micha艂ki

Z powodu koronawirusa prze艂o偶ono prace nad standardem Unicode 14, wi臋c nowe emotikonki zatwierdzone w 2021 trafi膮 do urz膮dze艅 dopiero w roku 2022.

Dzie艅 po og艂oszeniu op贸藕nienia witryna unicode.org pad艂a na ponad dob臋. Przypadek?

Prawdopodobnie najbardziej z艂o偶ony pojedynczy znak unicode to 锓 – jest to cz臋sto u偶ywane arabskie zapo偶yczenie w j臋zyku Urdu, kt贸rego nie da艂oby si臋 艂atwo wpisa膰 z klawiatury w uk艂adzie Urdu.

Poniewa偶 Unicode zawiera tysi膮ce znak贸w z naprawd臋 wielu alfabet贸w, mo偶na znale藕膰 symbole wygl膮daj膮ce jak lustrzane odbicia alfabetu 艂aci艅skiego i nie tylko: lns蕠晒z蓯u菨 opq岽壣斸磯蓯 饾敠 饾敶饾敠饾敘饾敥饾敘 饾敠饾敨饾敨饾敹饾敔饾敟 喙 喙掄竸谐喙斦灌箯 喔箑褦森褦 喙喔犩笭抓蟼褣. Zabawki do generowania rozmaito艣ci tutaj oraz tutaj.

Je艣li chcesz doda膰 do Unicode swoje w艂asne znaki, mo偶esz to zrobi膰 ju偶 dzi艣 – standard przewiduje ponad 137 tysi臋cy indeks贸w znak贸w zarezerwowanych do prywatnego u偶ytku, nigdy nie zostan膮 u偶yte w oficjalnej specyfikacji.

Je艣li brakuje Ci zwariowanych emotek, zajrzyj do klawiatury Gboard i bloga Google – Kuchnia Emoji pozwala miesza膰 r贸偶ne emotki i u偶ywa膰 wynikowego obrazka jako stickera w popularnych komunikatorach.

Na stronie emojitracker.com mo偶esz 艣ledzi膰 licznik u偶ycia r贸偶nych emoji w Twitterze. Gdy pisz臋 te s艂owa, numer jeden (馃槀) ma 2.785.586.369 wyst膮pie艅.


Drogi czytelniku/czytelniczko – mam pro艣b臋. Je艣li podoba艂 Ci si臋 niniejszy artyku艂, prze艣lij go kilku innym osobom kt贸rym te偶 mo偶e si臋 spodoba膰. Przygotowanie tekst贸w o takiej d艂ugo艣ci i r贸偶norodno艣ci trwa wiele godzin roz艂o偶onych na wiele wieczor贸w, wi臋c nie pojawiaj膮 si臋 one jako艣 strasznie cz臋sto. Mam jednak nadziej臋, 偶e – podobnie jak ja – lubisz d艂ugie teksty pe艂ne odno艣nik贸w do r贸偶nych zasob贸w dodatkowych. Daj zna膰 w komentarzu, je艣li uda艂o ci si臋 dotrze膰 a偶 tu.

Dla ch臋tnych jest te偶 Twitter, Facebook i Linkedin, gdzie anonsuj臋 ka偶dy kolejny artyku艂 i czasem dorzucam dodatkowe informacje czy linki, w zamian przyjmuj膮c skromne ilo艣ci lajk贸w. Poni偶ej mo偶esz zapisa膰 si臋 na newsletter, tam NIE daj臋 zna膰 o nowych tekstach. Dostaniesz jednego maila na wiele tygodni ale o tym, o czym koniecznie b臋d臋 chcia艂 poinformowa膰. Na razie!



O autorze: zawodowy programista od 2003 roku, pasjonat bezpiecze艅stwa informatycznego. Rozwija艂 systemy finansowe dla NBP, tworzy艂 i weryfikowa艂 zabezpieczenia bankowych aplikacji mobilnych, bra艂 udzia艂 w pracach nad gr膮 Angry Birds i wyszukiwark膮 internetow膮 Microsoft Bing.


4 odpowiedzi na “Emotikonki, Unicode, kodowanie znak贸w, bezpiecze艅stwo, 馃樂馃”

+1 za odniesienie do Joela. Jak pierwszy raz trafi艂em na jego blog te wszystkie lata temu (a SO jeszcze wtedy nie by艂o), to by艂a to dawka skondensowanej wiedzy i do艣wiadczenia… Zreszt膮 wci膮偶 tam wracam po konkretne odniesienia i artyku艂y dla znajomych, kt贸rzy dopiero w ten 艣wiat wkraczaj膮.

Dodaj komentarz

Tw贸j adres email nie zostanie opublikowany. Pola, kt贸rych wype艂nienie jest wymagane, s膮 oznaczone symbolem *