波ダッシュと全角チルダ問題
FirstUPDATE2023.2.18
@Scribble #Scribble2023 #プログラミング #インターネット 単ページ HTML 波ダッシュ 全角チルダ 文字化け 文字コード

先日も予告しましたように、4月にサイトの超絶リニューアルを予定しているのですが、何しろ今回は「完成形」を目指しているので、やっぱ、大変は大変なわけで。

さて、みなさんは「波ダッシュ」と「全角チルダ」の違いをご存知でしょうか。
いや違いどころかどっちも聞いたことねーよ、という人は、申し訳ないですが説明するとメチャクチャややこしいので各自検索お願いします。
とにかくね、ま、パソコンでもスマホでも、「なみ」もしくは「から」もしくは「ちるだ」と入力してみてください。すると↓こんな感じの、「東京から大阪」の「から」の記号などに使われる文字が出てくるはずです。



んでね、とくに「から」を入力した時に起こるんだけど、ほとんど似たような文字がふたつあるはずです。ですがこのふたつは同一ではない。
具体的にはこれが「波ダッシュ」と「全角チルダ」ということになるんだけど、もちろんフォントにも依るんだけど、もう、このふたつの違いを初見で見分けられる人なんていないと思う。
仮に見分けられたとしても、特別メリットもないわけで、つまりこんなこと、ウェブプログラミングでもやらない限りは、いわばどうでもいいことです。

じゃあアタシは、というとです。
たしかにアタシは仕事でウェブサイトを作ることがあるから波ダッシュと全角チルダの違いっつーか「見分けられないけど違う」ってのは知ってた。
とはいえね、ごく普通のHTML構築であれば、実はあんまり考慮しなくてもいいんですよ。
HTMLのヘッダーに文字コードを指定するのは常識ですが、ここでちゃんと「UTF8」というように指定しておけば、以降、UTF8が使えるウェブ作成ソフトやテキストエディタを使えば別段問題は起こらないわけで。
ところがアタシは違うわけですよ。


↑にも書いたように、アタシはMortScriptなる「もう世界中で誰も使ってない」スクリプトを使っている。もちろんHTML構築にも全面的に活用しているのですが、これも上記エントリに書いたように、このMortScript、文字コードがね、shiftjis以外扱えないのです。いやリードは出来るけどライトがダメっていう。
ライトがダメっても、nkfなんかのソフトを併用すれば一応UTF8でも書き出せるんだけど、とにかく、このMortScriptを使う限りはshiftjisとUTF8というふたつの文字コードを行ったり来たりすることになるわけで。

だから、どうしても、文字化け問題が頻発していた。
何故なら、そう、波ダッシュと全角チルダ問題があるからなんです。
波ダッシュの場合はあからさまな文字化けが起こるし、全角チルダの場合はすべて「?」(←ややこしいので全角にしたけど本当は半角の<?>)になってしまう。
つまりね、文章を書いてる時は「これは波ダッシュか全角チルダか」なんて意識してないから、全部の対応が求められて、スクリプトがメチャクチャややこしくなるっつー。

しょうがないから今回、すべてコード番号に置き換えた。具体的には「~」に見える文字すべてを「~」(これも表記上全角にしてるけど記号はすべて半角)にするという。
これ、本当はやりたくなかった。何故ならテキストエディタで見た時に著しく可読性が落ちるからで、でも今回は「過去に自分の書いた文章を読み返したければ、ウェブで読み返す」という方針に切り替えたのもあって、じゃあ、やろうと。

それにしても、ウェブプログラミングって「あんなのプログラミングにも入らない」なんて莫迦にされがちだけど、CSSなんかとくにだけど、マジでややこしいわ。
「わからなければコピペすればいい」っていうけど、ある程度理屈がわかってないと検索のしようもないし。あー、しんどいわ~







Copyright © 2003 yabunira. All rights reserved.