Unicode: atrás da cortina
O Unicode Consortium comemorou seu 25º aniversário no ano passado. A verdade é que, apesar de todo o trabalho que o Unicode faz para garantir o texto de idiomas em todo o mundo – a maioria de nós conhece o Unicode como o grupo que aprova novos emojis.
O que pode não ser tão claro é por que um grande consórcio é necessário ou a complexidade oculta do Unicode. Ou como os emojis de vômito mostrados no desenho XCKD acima já são considerados “válidos (mas não recomendados)”.
Mark Davis, co-fundador e presidente do UNICODE, procurou esclarecer como emoji se encaixa no Unicode nesta visão geral de alto nível que analisa o que é unicode e como o subcomitê de emoji unicode (“emoji sc”) se encaixa isto.
Davis observa que os emojis compõem apenas uma fração do número total de caracteres no padrão Unicode. Você mal consegue sair neste gráfico:
Os personagens sozinhos não contam metade da história. Vários glifos precisam combinar quando exibidos em determinadas ordens ou combinações.
Uma combinação que será familiar para muitos é como os tons de pele emoji são implementados.
Estes trabalham detectando quando um personagem modificador é exibido após emoji humano, como a 👧 Girl. Estes combinam em plataformas suportadas para mostrar um único emoji:
Uma implementação mais complicada envolve unir dois ou mais emojis no que é chamado de sequência emoji zwj.
Estes são usados para criar profissões como a 👩⚖️ Mulher Juiz. Este emoji é criado usando os emojis 👩 Woman e ⚖ ⚖ás em escala de equilíbrio em sequência.
Um caractere “ZWJ” (zero lidra de largura) fica entre esses dois emojis e é uma cola invisível que une vários emojis em um (onde apoiado).
Outros tipos de sequências ZWJ listam um emoji existente, como 🕵️ Detetive com um símbolo de gênero ♀️ signo feminino adicionado após ele.
Esse tipo de sequência ZWJ geralmente é usado se já existir um emoji. Por exemplo: corredor, surfista ou muitos dos gestos.
E sim, você pode combinar modificadores e ZWJs para criar uma sequência mais longa.
O Unicode não controla as sequências ZWJ da mesma maneira que os novos emojis que exigem seu próprio ponto de código.
UNICODE sequências recomendadas que devem ser suportadas para consistência entre plataformas. No entanto, os fornecedores são livres para combinar qualquer emoji com qualquer outro, como acharem melhor.
A Microsoft possui seis gatos ninjas disponíveis no Windows, que não fazem parte da lista recomendada pela Unicode. 🐱 O rosto do gato e o foguete são combinados no Windows 10 para mostrar um emoji para 🐱🚀 Astro Cat.
O Astro Cat é válido (pois usa uma estrutura de sequência correta), mas não é recomendada como outras profissões e sexos.
XKCD sugeriu que o vômito deveria ser um personagem modificador para fazer um “cowboy vômito”.
Davis ressalta que 🤠 🤠 🤠 🤠 🤠 🤠 🤠 🤠 🤠 🤠 🤠 🤠 O rosto de chapéu de cowboy já poderia ser combinado com 🤮 🤮 vômito de face para criar uma sequência ZWJ válida:
Outros tipos de sequência existem para emoji, incluindo sequências de sinalizador, sequências de tags e seqüências de chaves. Você deve conferir todo o conjunto de slides para vê -los com mais detalhes.
Finalmente, uma olhada no cronograma (atual de 2017) de como nasce um novo emoji:
🚨 Atualização de abril de 2020: O cronograma atual de como um novo emoji é criado foi significativamente impactado pela pandemia CoviD-19. Você pode ler mais sobre o cronograma revisado para 2020 e além aqui.
Claro que o Unicode ainda tem muito o que fazer fora do suporte emoji:
“Existem aproximadamente 7.000 línguas humanas vivas, com níveis variados de vitalidade. Menos de 100 desses idiomas são bem apoiados em computadores, telefones celulares e outros dispositivos, enquanto todo o restante corre o risco de ser desvantada digitalmente”
O Unicode tem um programa de personagens adotado. Os fundos levantados com as adoções vão para a pesquisa para apoiar essas línguas desvantadas digitalmente.
Mais:
Unicode emoji por Mark Davis
Unicodo Adote um personagem
Novos emojis para 2017
Hacks de emoji divertidos
Pesquisar emojis: