<div dir="ltr"><div class="gmail_extra"><div class="gmail_quote">On Wed, Jun 6, 2018 at 9:51 AM, Fred Hebert <span dir="ltr"><<a href="mailto:mononcqc@ferd.ca" target="_blank">mononcqc@ferd.ca</a>></span> wrote:</div><div class="gmail_quote"><br><blockquote class="gmail_quote" style="margin:0px 0px 0px 0.8ex;border-left:1px solid rgb(204,204,204);padding-left:1ex"><div dir="ltr"><div class="gmail_extra"><span class="gmail-"></span><div>That's fine and good, but the problem comes from the fact that graphical (and logical) representation is not equal to the underlying codes creating the final character. Those exist for all kinds of possible ligatures and assemblies of "character parts" in various languages, but for Emojis, you can also make a family by combining individual people:<span class="gmail-m_-967868024970032034emoji"> 👩‍👩‍👦‍👦 is a family composed of 4 components with combining marks: 
 👩 + 
<span class="gmail-m_-967868024970032034emoji">👩</span> 


 👦 + <span class="gmail-m_-967868024970032034emoji">👦</span>, where + is a special combining mark (a <i>zero width joiner</i>) between two women and two boys. If you go ahead and consume that emoji using the <span style="font-family:monospace,monospace">/utf8</span> modifier, you'll break the family apart and change the semantic meaning of the text.</span></div><div><span class="gmail-m_-967868024970032034emoji"><br></span></div><div><span class="gmail-m_-967868024970032034emoji"> If you edit the text in a text editor that traditionally has good support for locales and all kinds of per-language rules, such as Microsoft Word (the only one I know to do a great job of automatically handling half-width spaces and non-breakable spaces when language asks for it), pressing backspace on 
<span class="gmail-m_-967868024970032034emoji">👩‍👩‍👦‍👦</span> will remove the whole family as one unit. If you do it in FireFox or Chrome, deleting that one 'character' will take you 7 backstrokes: one for each 'person' and one for each zero-width joining character. Slack will consider them to be a single character and visual studio code behaves like the browsers (even if both are electron apps), and notepad.exe or many terminal emulators will instead expand them as 4 people and implicitly drop the zero-width joining marks. <br></span></div><div><span class="gmail-m_-967868024970032034emoji"></span></div></div></div></blockquote><div><br></div><div>Well this kind of illustrates my point. Instead of seeing the unicode family as 4 joined people in one unit (see <a href="https://emojipedia.org/family-woman-woman-boy-boy/">https://emojipedia.org/family-woman-woman-boy-boy/</a>), it appears gmail has expanded the family into 4 distinct people. So please use the emojipedia reference when reading my previous e-mail.<br></div></div><br></div></div>