Jak převést webovou stránku na soubor PDF nebo obrázky v systému Linux

Jak převést webovou stránku na soubor PDF nebo obrázky v systému Linux

Chcete vědět, jak můžete pomocí terminálu zachytit webovou stránku a uložit ji jako dokument PDF nebo obrázek? Naštěstí má Linux nepřeberné množství nástrojů, které můžete použít k automatizaci převodu dokumentů HTML na soubory a obrázky PDF.





Tento článek vám představí nástroje wkhtmltopdf a wkhtmltoimage, nástroje, které vám usnadní práci.





Jak převést HTML do PDF

Pokud chcete zachytit webové stránky a převést je do souboru PDF, pomůže vám nástroj wkhtmltopdf. Wkhtmltopdf je nástroj příkazového řádku s otevřeným zdrojovým kódem, který se používá k vykreslování webových stránek do dokumentů PDF.





Protože nástroj pracuje bezhlavě uvnitř terminálu Linux, nebudete potřebovat žádný webový ovladač ani rámec pro automatizaci prohlížeče, jako je Selenium.

Nainstalujte wkhtmltopdf na Linux

Wkhtmltopdf nepatří ke standardním balíčkům, které jsou v Linuxu předinstalovány. Budete jej muset nainstalovat ručně pomocí správce balíčků vašeho systému.



Chcete-li nainstalovat wkhtmltopdf na distribuce založené na Ubuntu a Debianu:

sudo apt install wkhtmltopdf

Na distribucích založených na Arch, jako je Manjaro Linux:





sudo pacman -S wkhtmltopdf

Instalace wkhtmltopdf do distribucí založených na RHEL, jako jsou Fedora a CentOS, je také snadná.

sudo dnf install wkhtmltopdf

Základní syntaxe

Základní syntaxe příkazu je:





wkhtmltopdf webpage filename

...kde webová stránka je adresa URL webové stránky, kterou chcete převést, a název souboru je název výstupního souboru PDF.

Chcete -li převést domovskou stránku Google na dokument PDF:

wkhtmltopdf https://google.com google.pdf

Výstup:

Při otevření souboru PDF si všimnete, že wkhtmltopdf přesně vykreslil webovou stránku do dokumentu.

The --kopie flag je zachránce, pokud chcete, aby váš výstupní soubor měl více kopií webové stránky. Pamatujte, že při tisku více kopií nebude wkhtmltopdf generovat více souborů PDF, ale místo toho přidá další stránky do jednoho dokumentu.

Chcete -li vytvořit tři kopie domovské stránky Google:

wkhtmltopdf --copies 3 https://google.com google.pdf

Výstupní soubor PDF bude obsahovat tři stránky, jak je uvedeno ve výše uvedeném příkazu.

Přidejte do výstupu filtr ve stupních šedi

Chcete -li do souboru PDF přidat filtr ve stupních šedi, použijte -G nebo -ve stupních šedi vlajka s příkazem:

wkhtmltopdf -g https://google.com google.pdf
wkhtmltopdf --grayscale https://google.com google.pdf

Výstupní soubor:

Změňte orientaci PDF

Ve výchozím nastavení wkhtmltopdf generuje soubor PDF ve svislém rozložení, tj. Na výšku. Chcete -li změnit toto výchozí chování a místo toho zachytit webové stránky na šířku, použijte --orientace vlajka s příkazem:

wkhtmltopdf --orientation landscape https://google.com google.pdf

Výstup:

Všimněte si toho, že verze dokumentu na šířku má ve srovnání s portrétem větší mezeru.

Nezahrnujte obrázky při převodu

Pokud při generování výstupu nechcete, aby wkhtmltopdf vykresloval obrázky přítomné na webové stránce, použijte --no-obrázky vlajka:

wkhtmltopdf --no-images https://google.com google.pdf

Výstup:

Příbuzný: Nejlepší nástroje pro úpravu souboru PDF kdekoli

Jak převést webovou stránku na obrázky

Nástroj wkhtmltoimage je součástí balíčku wkhtmltopdf. Pokud pracujete na zprávě a chcete zahrnout obrázky webových stránek, bude tento nástroj fungovat ve váš prospěch. Terminál Linux vám nejen usnadní pořizování obrázků, ale také vám poskytne řadu možností, které vám umožní přizpůsobit výstup.

jak zrychlit stahování přes torrent

Základní syntaxe

Wkhtmltoimage má syntaxi podobnou wkhtmltopdf:

wkhtmltoimage webpage filename

...kde webová stránka je adresa URL webové stránky a název souboru je název výstupního obrázku.

Převeďte webovou stránku na obrázek

Pokračujeme ve výše uvedeném příkladu a převedeme domovskou stránku Google na obrázky.

wkhtmltoimage https://google.com google.png

Výstup:

Můžete také určit vlastní formát souboru, který má mít výstupní obrázek. Wkhtmltoimage podporuje následující přípony souborů:

  • JPEG/JPG
  • PNG
  • SVG

Pokud například chcete generovat obrázek JPG, jednoduše nahraďte příponu souboru příkazem JPG:

wkhtmltoimage https://google.com google.jpg

Příbuzný: JPG vs. JPEG: Jaký je rozdíl mezi těmito formáty obrazových souborů?

Zachycování webových stránek pomocí terminálu Linux

Chcete -li zobrazit soubory PDF generované wkhtmltopdf, musíte mít v systému Linux nainstalován prohlížeč PDF. Zatímco většina distribucí Linuxu je dodávána s předinstalovaným editorem PDF, můžete si ručně vybrat a nainstalovat editor PDF, který vyhovuje vašim potřebám.

Podíl Podíl tweet E-mailem 5 nejlepších Linuxových editorů PDF, které byste měli vyzkoušet

Potřebujete upravit soubor PDF v Linuxu? Tyto Linux PDF editory se instalují zdarma a snadno se používají.

Číst dále
Související témata
  • Linux
  • PDF
  • Linux
O autorovi Deepesh Sharma(79 článků zveřejněno)

Deepesh je juniorský editor pro Linux na MUO. Píše informační příručky pro Linux s cílem poskytnout všem nováčkům blažený zážitek. Nejste si jisti filmy, ale pokud chcete mluvit o technologii, je to váš chlap. Ve svém volném čase ho můžete najít číst knihy, poslouchat různé hudební žánry nebo hrát na kytaru.

Více od Deepesh Sharma

Přihlaste se k odběru našeho zpravodaje

Připojte se k našemu zpravodaji a získejte technické tipy, recenze, bezplatné elektronické knihy a exkluzivní nabídky!

Kliknutím sem se přihlásíte k odběru