「波ダッシュ」と「全角チルダ」の沼にハマる

何気なく使っている「~」の文字。
実はこの文字が結構問題となっていることに気づいた。

例えば日付や駅などの期間表示する時など。

2024/03/20 ~ 2024/05/20
昭和 ~ 令和
東京駅 ~ 品川駅

とか。

しかし表示上の見た目が似ているこの文字には実は2種類ある。

これ違う文字なのだ。
(わかりやすいように、以下からはマーカーで違いを表記)
 ↓

」 → 波ダッシュ「 WAVE DASH 」(U+301C)
」 → 全角チルダ「 FULLWIDTH TILDE 」(U+FF5E)

見た目じゃわからないよね。

だけど問題となるのは、文字検索をした場合など。
違う文字なのだから、どっちかしか検索でヒットしないことになる。

さらに、

Mac で「から」と変換→「 」(波ダッシュ)が出てくる
Windows で「から」と変換→「 」(全角チルダ)が出てくる

ということ。なんでこんな事になったのか?

どうも調べてみるとこの文字の意味の違いは、

波ダッシュ 」は、
日本語で範囲を表す際に使用される約物

全角チルダ 」は、
数学記号の一種で、「漸近的に等しい」ことを表し、
プログラミングでも使われる記号。

ということらしいのだが、
結局見た目でわからないから、やっかいで。

特に MacWindows でテキストのやり取りしているとしたら、
この二つの文字が混在することになる。

今はどちらのOSでも基本的な文字コードUnicode になっているので、
文字化けしないが、Mac波ダッシュを入力した文字が、
昔の文字コード Shift-JIS に変換した時に、
波ダッシュは文字化けを起こすが、全角チルダは文字化けしない。

自分が思うに、結論としては、

見た目同じに見える文字だけど、
波ダッシュと全角チルダは別文字である。
MacWindows とのやり取りで「 」「 」の文字を利用する際には、
違う文字なので気を付けること。

ってことかな。

最新のOSで利用している際には、見た目では特に問題にはならないけど、
文字検索や、アプリによって文字コードが Shift-JIS となっているものについては、
注意が必要で、その際には全角チルダ 」を使う事。

特に Mac は「から」変換で、波ダッシュ 」になるので注意すること。

とはいえ、現実的にそのアプリが Shift-JIS かどうかなんて普通わからないから、
」が文字化けを起こしていたら、それは波ダッシュなので、
文字化け解消には全角チルダ 」に置き換えること、かな。

Webサイトでこの文字を利用する際には、
文字コードUnicode に指定して、数値文字参照を使えば間違いない。

波ダッシュの場合「 〜 」
全角チルダの場合「 ~ 」

なんともやっかいな文字の話でした。

▼▼▼▼▼

見事なツツジ

見事なツツジ

あれ、君はどこから?

あれ、君はどこから?