Jak třídit textové soubory v Linuxu pomocí příkazu sort

Jak třídit textové soubory v Linuxu pomocí příkazu sort

Linux vám poskytuje několik nástrojů, které můžete použít ke zpracování textových souborů. Ať už chcete odstranit duplicitní data nebo třídit obsah v souboru, nástroje příkazového řádku Linuxu mají vše, co potřebujete.





Tento článek předvede příkaz sort a jak jej můžete použít k třídění obsahu uvnitř textového souboru a podle toho jej uspořádat.





Co je to příkaz řazení?

Jak bylo uvedeno výše, příkaz sort pomáhá uživateli uspořádat obsah textového souboru v určitém pořadí. K dispozici je několik možností, které vám umožňují třídit soubor podle vašeho přání. Je to standardní linuxový program, který dokáže řadit textový soubor abecedně, číselně, podle sloupců a další, v normálním nebo opačném pořadí.





Mezi další funkce příkazu patří ignorování znaků při třídění, třídění souboru podle měsíců, ignorování mezer v souboru a náhodné třídění. Pomocí řazení můžete také zkontrolovat, zda je soubor již seřazen nebo ne.

Jak používat třídění v Linuxu

Přestože řazení obsahuje několik metod a příznaků, které můžete použít, je snadné se ho naučit.



Základní syntaxe

Základní syntaxe použití sortu je:

sort filename

...kde název souboru je absolutní nebo relativní cesta textového souboru, který chcete řadit.





Ve výchozím nastavení řazení uspořádá obsah podle následujících kritérií:

  1. Nejvyšší prioritu mají řádky začínající číselnými znaky.
  2. Příkaz seřadí řádky podle abecedy po seřazení řádků začínajících čísly.
  3. Řádky začínající malými písmeny předcházejí řádkům začínajícím stejným znakem velkými písmeny.

Zvažte textový soubor s názvem textfile.txt obsahující následující informace:





Chcete -li soubor seřadit pomocí výchozí konfigurace:

sort textfile.txt

Výstup:

Vytvořte nový výstupní soubor

Příkaz sort nemění obsah souboru. Jednoduše odešle seřazený obsah na standardní výstup. To však neznamená, že tříděním nelze vytvořit nový soubor. Můžete použít -nebo příznak pro zadání názvu seřazeného souboru a řazení automaticky vytvoří soubor pro vás a přidá obsah.

kde sehnat levné počítačové součástky
sort -o sortedfile filename

...kde tříděný soubor je název výstupního souboru a název souboru je původní soubor, který potřebuje třídění.

Seřadit textfile.txt a vytvořte nový výstupní soubor pro obsah:

sort -o sorted.txt textfile.txt

Výstup:

Seřadit více souborů

Chcete -li seřadit více než jeden soubor najednou, jednoduše předejte názvy souborů oddělené Prostor charakter.

sort textfile.txt textfile2.txt

Výstup:

Všimněte si, že třídění sloučí výstup souborů a zobrazí je společně v terminálu.

Obrátit Seřadit soubor

Pokud chcete změnit uspořádání obsahu, použijte -r vlajka s výchozím příkazem. The -r v následujícím příkazu znamená Zvrátit .

sort -r textfile.txt

Výstup:

Seřadit soubor číselně

Chcete -li seřadit soubor obsahující číselná data, použijte -n vlajka s příkazem. Ve výchozím nastavení seřazení uspořádá data vzestupně.

sort -n numbers.txt

Výstup:

Pokud chcete řadit sestupně, změňte uspořádání pomocí -r možnost spolu s -n vlajka v příkazu.

sort -rn numbers.txt

Výstup:

Při třídění ignorujte velká a malá písmena

Ve výchozím nastavení třídění zohledňuje velikost znaků obsahu. Řádky začínající malými písmeny předcházejí řádkům začínajícím velkými písmeny stejného znaku. Například „on je chlapec“ bude předcházet „On je chlapec“.

Pokud chcete, aby řazení ignorovalo velká a malá písmena, zadejte -F nebo --ignorovat případ označte takto:

sort -f textfile.txt
sort --ignore-case textfile.txt

Výstup:

Seřadit soubor podle měsíce

Za použití -M příznak, můžete upravit pořadí obsahu souboru podle názvů měsíců.

sort -M textfile2.txt

Výstup:

Ignorujte Leading Blanks

Někdy může soubor, který chcete seřadit, obsahovat mezery nebo tabulátory. Chcete -li ignorovat takové prázdné znaky, použijte -b vlajka.

sort -b fileblanks.txt

Výstup:

Seřadit soubor podle sloupce

Pokud máte textový soubor s daty uspořádanými v samostatných sloupcích, můžete soubor seřadit podle obsahu sloupce. Vše, co musíte udělat, je předat číslo sloupce spolu s -k vlajka.

Zvažte textový soubor obsahující informace o souboru s různými sloupci. Seřadit soubor s názvem output.txt podle osmého sloupce:

xbox se nemůže připojit k internetu
sort -k8 -rn output.txt

Výstup:

Řazení potrubí jinými příkazy

Uspořádání výstupu můžete dokonce upravit pomocí řazení s jinými příkazy Linuxu. Chcete -li například třídit výstup příkaz ls podle velikosti souborů:

ls -la | sort -k5 -rn

Výstup:

Seřadit soubor náhodně

Můžete použít -R příznak, pokud chcete náhodně pořadí řádků v textovém souboru. Zvažte soubor textfile.txt :

sort -R textfile.txt

Výstup:

Seřadit čísla verzí v souboru

Pokud máte k balíčku textový soubor obsahující informace o verzi, můžete jeho obsah seřadit pomocí -PROTI nebo --version-sort vlajka.

jak získat smazané facebookové zprávy
sort -V version.txt
sort --version-sort version.txt

Výstup:

Zkontrolujte, zda je soubor seřazen

The -C flag vám pomůže při identifikaci souborů, které jsou již seřazeny podle zadaných možností. Pokud je obsah souboru správně seřazen, řazení nezobrazí žádný výstup.

Chcete -li zkontrolovat, zda soubor textfile.txt je seřazeno:

sort -c textfile.txt

Nyní soubor seřaďte a uložíme jeho výstup do nového souboru s názvem tříděný.txt . Při vydání následujícího příkazu:

sort -c sorted.txt

Výstup:

Můžete také zadat různé příznaky pro kontrolu uspořádání souboru podle konkrétních kritérií. Chcete -li například zkontrolovat, zda soubor numbers.txt je seřazeno sestupně:

sort -c -rn numbers.txt

Uvidíte výstup oznamující, že soubor není správně seřazen. Pojďme soubor seřadit a zkontrolovat, zda nový soubor projde testem.

sort -o sorted.txt -rn numbers.txt
sort -c -rn sorted.txt

Výstup:

Seřaďte soubor a odeberte duplikáty

Soubor, se kterým pracujete, může obsahovat duplicitní data. I když můžete použít příkaz uniq Chcete -li takové informace ze souboru odebrat, může třídění provést tento úkol za vás. The -u nebo --unikátní vlajka je to, co potřebujete.

Zvažte soubor s názvem duplicate.txt :

Chcete -li soubor seřadit a odebrat opakovaná data:

sort -u duplicate.txt

Výstup:

Můžete to vidět, když použijete -u příznak, třídění zobrazí pouze odlišné řádky a uspořádá je podle zadaných kritérií.

Práce s textovými soubory v Linuxu

Přestože je síla textových editorů příkazového řádku nesrovnatelná, můžete se přesto rozhodnout pro grafický editor, jako je například gedit, pro snadnou úpravu obsahu textového souboru. Také je to lepší volba pro ty, kteří jsou v Linuxu noví a neumí si poradit s terminálem.

Nejlepší způsob, jak začít s příkazovým řádkem a Linuxem obecně, je nejprve procvičit základní příkazy. Po pokrytí základních nástrojů je postup k složitějším příkazům pravděpodobně nejlepším přístupem.

Podíl Podíl tweet E-mailem Cheat Sheet referenční příručky Linuxu

Tento jednoduchý cheat list vám pomůže rychle se seznámit s terminálem příkazového řádku Linuxu.

Číst dále
Související témata
  • Linux
  • Správa souborů
  • Linux
  • Příkazy Linux
O autorovi Deepesh Sharma(79 článků zveřejněno)

Deepesh je juniorský editor pro Linux na MUO. Píše informační příručky pro Linux s cílem poskytnout všem nováčkům blažený zážitek. Nejste si jisti filmy, ale pokud chcete mluvit o technologii, je to váš chlap. Ve svém volném čase ho můžete najít číst knihy, poslouchat různé hudební žánry nebo hrát na kytaru.

Více od Deepesh Sharma

Přihlaste se k odběru našeho zpravodaje

Připojte se k našemu zpravodaji a získejte technické tipy, recenze, bezplatné elektronické knihy a exkluzivní nabídky!

Kliknutím sem se přihlásíte k odběru