テキストソートとは
テキストの各行を特定の基準で並べ替える処理です。データ整理、ログ分析、ファイル名の整理などに活用できます。
自然順ソートの仕組み
通常の辞書順では「file10」は「file2」の前に来ますが、自然順ソートでは数値部分を数値として比較するため「file1, file2, file10」の順になります。本ツールではIntl.Collatorを使用して実装しています。
重複削除のアルゴリズム
Set(集合)を使用してO(n)の計算量で重複を検出します。最初に出現した行を保持し、以降の重複行を削除します。