Excel貼り付けデータの整理テクニック
Excelのセルからコピーしたテキストには、目に見えないノイズがびっしり詰まっています。本ツールと関連ツールを組み合わせて、誰でも10分で整える手順をまとめます。
1. ExcelのTRIMは全角空白を消さない
Excelの TRIM 関数は「半角空白U+0020」だけを除去対象とし、「全角空白U+3000」は除去しません。日本語データで「見た目では空白だけど検索ヒットしない」という時の主犯がこれ。CLEAN関数も制御文字(CHR 1–31)の除去はしますが、全角空白には触りません。本ツールの「前後空白除去」はU+0020とU+3000の両方を対象にしています。
2. セル内改行(Alt+Enter)の取扱い
Excelで Alt+Enter を入力するとセル内に LF(U+000A)が挿入されます。これをコピー→他アプリに貼ると、「1セル=1行」のはずが「1セルが複数行」に変換されることがあります。逆に複数セルを縦に選択してコピーすると、セル間は CR/CRLF で結ばれます。Excelからの貼り付け結果が「想定の行数と違う」ときは、まず元データのAlt+Enter混在を疑ってください。
3. 複数列をコピーするとタブが入る
複数列を横に選択してコピー→テキストエディタに貼ると、列区切りがタブ文字(U+0009)になります。本ツールは1行単位の処理なので、行内のタブは保持されます。タブ込みのまま重複判定すれば「列の組合せが重複」を検出できるので、CSV的に扱えます。タブを除去したい場合は文字列置換で「\t→空」に変換してから本ツールに戻す流れがおすすめ。
4. 文字コードの違いを揃える
日本語ExcelデータにはShift_JIS(CP932)由来の「波ダッシュ U+301C」と Unicode の「全角チルダ U+FF5E」、「マイナス U+2212」と「全角ハイフン U+FF0D」など、見た目同じで内部コードが違う文字が混在することがあります。本ツールは「文字列の完全一致」で重複判定するため、コード違いの行は別物扱い。先に全角半角変換で揃えてから本ツールに渡すと精度が上がります。
5. メールアドレス一覧の整理ワークフロー
①Excelからメールアドレス列を選択してコピー→本ツールに貼り付け、②「前後空白除去」「空行削除」「重複削除」をON、③出力をコピーしてメール配信ツールにペースト、④件数が想定と違えば「五十音順並べ替え」をONにして目視チェック。BCC欄の不正形式(@抜け・末尾コンマ)を検出したい時は、整理後にテキスト差分で前後比較すると効率的です。
6. CSV出力で「Excelで開いたら文字化け」を防ぐ
整理した行をCSVとして配布する場合、文字コードは UTF-8 BOM付きが安全。詳細はBOM解説を参照。改行コードはWindows Excel前提なら CRLF、Mac前提なら LF。本ツールの出力は LF なので、Windows Excel配布時はメモ帳側で「LF→CRLF」変換してから保存してください。仕組みは改行コード解説へ。