« 2012年6月 | トップページ | 2012年9月 »

2012年8月19日 (日)

エディタmiと正規表現使ったテキスト整形。

 まず、予備知識として、

http://oshiete.goo.ne.jp/qa/2935449.html
★『\n』と『\r』は違いますよ。
・『\n』が改行コードです。
 『\r』は復帰コードです。
 下の『参考URL』をどうぞ。
・あと OS により改行の表現が異なります。
 Windows は CR+LF(\r\n)の2文字で表現しています。
 Unix系 は LF(\n)の1文字で表現しています。
 Mac OS は CR(\r)の1文字で表現しています。

CR【Carriage Return】
http://e-words.jp/w/CR.html

ASCII文字コード体系に定められた制御文字の一つ。「行頭復帰」を意味している。コードは0x0D(13)。

改行コードはシステムの種類によって標準的に用いられるものが異なり、MS-DOSやWindowsなどではCRLF(0x0D+0x0A)を、かつてのMac OSなどではCRを、UNIX系システムと現在のMac OS XなどではLFをそれぞれ用いる。

LF【Line Feed】
http://e-words.jp/w/LF.html

ASCII文字コード体系に定められた制御文字の一つ。「改行」を意味している。コードは0x0A(10)。

 

 以下、エディタmiと正規表現使ったテキスト整形についてのメモ。

 文字のある行の末尾の改行コードだけ取りたかった。

Photo_7 1、で、行末の改行コードと言う事で「\r$」で検索&置換(←は文字無しで)して見た。


Photo_8 2、なんと、文字のある行ではなく、そうでない所の改行コードだけ削除された。「\r$」だけでなく、「^\r、^$\r、\r$」についても同じ結果だった。


Photo_9 3、ではと言うことで、\r$、^\r、^$\r、\r$ 以外の所の改行コードを削除と言う事で、取り敢えず [^\r$]\r で検索&置換(←は文字無しで)して見たのだが、


Photo_10 4、いわゆる文字のない改行コードが3個消えている。それだけではなく文字のある行の改行コードが削除され1行になったのは良いのだが、すべての末尾の一文字「い」も消えている。これでは使えない。


Photo_11 5、今度は、^\r$ で検索&置換(←は文字無しで)して見ると、


Photo_126、文字無し行の改行コードが1個ずつ残り、それ以外の文字無し行の改行コードが5箇所消えている。

なので、余計な文字無し行の改行コードを1個だけ残して他は削除し、「文字のある行の末尾の改行コードだけ削除」するには、


Photo_137、単純に5のやり方ではなく、最初に ^\r$ で検索し、置換は<br />にすると、


Photo_158、になるので、次に\r で検索&置換(←は文字無しで)すると、


Photo_14 9、になる。最後<br />で検索し、\r\r で置換すると、
Photo_16 10、となる。

 今回やってみて分かったのは、エディタでの正規表現を使った文章整形などはMacよりWindows、特にQXエディタの使いやすさが際立っていることだった。


 なお、URLでよく使われるスラッシュ / だが(斜線 SOLIDUS、oblique、slash)、逆スラッシュ \ はmiだと直接入力にするとdeleteキー左隣りのキーで出る。コマンドキー+でdeleteキー左隣りのキーを押下すると¥が出る。ところが、CotEditorでやると、deleteキー左隣りのキーで¥が出て、コマンドキー+でdeleteキー左隣りのキーを押下すると逆スラッシュ \ が出る。どう言う訳か逆になる。

mi関連:
miエディタをmi3にVerアップしたら、な、なんと全角スペースがまるで半角スペースみたいに…。で、この方法で解決。

始めに戻る


 

ひなたぼっこは良質な情報への中継点

(↓クリックすると拡大)
自民党は自Endバナー 自民党は自Endバナー の猫ちゃんつながりブログを倭国大乱を記録するブログの数々として見つける毎に適宜追加。但し結構忘れてます(汗)

 ココログ利用で、即行で以下のTBPライブリンクをサイドエリアへはりたければ⇒一輪のバラをクリック。

 以下、登録・スタートさせたトラックバック・ピープルです。
主権者国民連合主権者は私たち国民自民党政治民主党政治社民党や共産党にトラックバックしてます。

 

※原発関連で3冊:

知事抹殺 つくられた福島県汚職事件 佐藤 栄佐久 (著)

原子炉時限爆弾 広瀬 隆 (著)

隠される原子力・核の真実―原子力の専門家が原発に反対するわけ 小出 裕章 (著)

| | コメント (0) | トラックバック (0)

« 2012年6月 | トップページ | 2012年9月 »