「ハイフン」って言ってもたくさん種類があるんだよ

Pocket
LINEで送る
GREE にシェア
LinkedIn にシェア

こんにちわ。
 

「*」アスタリスクと聞くと、オールマイティ感を感じる、正規表現的な脳みそになっている、下駄です。
 

本日のIT謎掛け。
 

「ハイフン」と、かけまして、
 

「心拍数の安静値」と、ときます。
 

そのココロは・・・
 

ダッシュするとマイナスになっちゃうよ。

ハイフンの種類の多さにビックリ

パソコンで「-」(マイナス)キーを全角モードで押すと、変換候補がたくさんリスト表示される時に、なんだかたくさんの「-」が存在する事に気がついた人もいると思います。
 


 

入りきっていないものも合わせて書き出すと、以下のような感じ。
 

 

macで表示しているので、見ているOSによっては、文字化けをしているものもあると思います。
 

中にはハイフンじゃないものもありますが、どうやら、ハイフン、ダッシュ、マイナス・・・と、名称がいくつかあることに気がつく。
 

もちろん文字コードも違うようだ。(コードはasciiコードと16進数)
 

 

下方にある、[半]と[全]は、それぞれ「ハイフン、マイナス」と同じことがわかるが、それ以外はバラバラだ。
 

半角カタカナと半角ハイフンの違いは、mac端末で見る限り、人の目で判断できるレベルではない。

システムエンジニアが遭遇するかもしれないハイフン・トラブル

おそらく、文章などで文字入力をする場合など、半角か全角かぐらいを気にすればいいかと思いますが、
 

システムに登録する文字列には、気を使わなくてはいけません。
 

例えば、ECサイトなどで、ユーザーの郵便番号や電話番号を登録させる時に、000-0000や03-0000-0000という風に書いた時にハイフンは、
 

通常のエンジニアであれば、半角ハイフンであると信じて疑わないでしょうが、
 

利用するユーザーがハイフンをどの文字コードのモノに変換してくるかは、正直不明です。
 

実際に、スマホサイトなどでやってみると、半角全角だけでなく、アンダースコア「_」などを入力するツワモノもいて、市外局番などに分解しようとする作業をかんがえると、なんとも、エンジニア泣かせの仕様です。
 

まあまあ使える正規表現サンプル

郵便番号
 

 

電話番号
 

 

javascriptのコードを使った正規表現サンプル
 

 

無事に全部ひっかかりました。
 

半角文字は”x”で、全角文字は”u”を頭につけている点に注意してね。

Leave a Reply

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です