Webcrawler & APIs für Webseiten erstellen: Kimono und Alternativen
Es gibt immer mehr zum Teil Cloud-basierte Apps, die das saubere Crawlen von Webseiten erlauben und darin enthaltene Daten extrahieren können. Ein besonders populäres Beispiel ist Kimono - eine App, die sowohl für Mac als auch Windows zur Verfügung steht - und die als…
Es gibt immer mehr zum Teil Cloud-basierte Apps, die das saubere Crawlen von Webseiten erlauben und darin enthaltene Daten extrahieren können. Ein besonders populäres Beispiel ist Kimono - eine App, die sowohl für Mac als auch Windows zur Verfügung steht - und die als kostenloser Webscraper eingesetzt werden kann.
Mit Hilfe von Kimono lassen sich Inhalte aus Webseiten so aufbereiten, dass sie anschliessend als standardisierter RSS-Feed, als Datenpaket im JSON-Format oder - sofern die Kimonolabs Cloud-Infrastruktur genutzt wird auch via eigener API (z.B. zur Weiterverwendung in eigenen Apps und Services) abrufen lassen.
Da die Kimonolabs nun den Onlinedienst einstellen und nur noch die Kimono Desktop Lösungen zur Verfügung stellen, die einen ähnlichen Funktionsumfang aufweisen aber eben auf die API verzichten, lohnt sich einmal ein Blick auf alternative Angebote.
Hier sind uns als online basierte Alternativen zu Kimono bislang folgende Dienste aufgefallen:
- Import.io - Extract web data the easy way. The world’s leading web data extraction platform for businesses and individuals.
- APIFIER - Web crawler that works on every website - free for developers (max. 40k pages/month).
- Scrapinghub - Turn web content into useful data. Scrapinghub provides a cloud-based web crawling platform, off-the-shelf datasets, and turn-key web scraping services.
- Parsehub - Turn dynamic websites into APIs (Free for 5 Public Project, 5 Pages/Minute, 200 Pages per Run).
- Scrapy - An open source and collaborative framework for extracting the data you need from websites. In a fast, simple, yet extensible way.
- Scrapinghub/Portia - Portia is the open source tool used in Scrapinghub that allows you to visually scrape websites without any programming knowledge required. With Portia you can annotate a web page to identify the data you wish to extract, and Portia will understand based on these annotations how to scrape data from similar pages.
Wir schauen uns diese Alternativen zu Kimono einmal in Ruhe an und ergänzen unsere Einschätzungen/Empfehlungen fortlaufend.
Welche Webscraping Lösung nutzt ihr und welche Erfahrungen habt ihr damit gemacht?
Weiterlesen .
Web & CodeFertiges Shell-Script: n8n auf einem DigitalOcean 1-Click-Droplet aktualisieren
In diesem Beitrag zeige ich dir Schritt für Schritt, wie du ein vollständiges Shellscript erstellst, das deine n8n-Installation auf einem DigitalOcean 1-Click-Droplet automatisch aktualisiert. Du lernst, wo du das Script speichern solltest, wie du es als root-User nutzt und wie…
Sonoya Redaktion
Web & CodeAnleitung: Websites & PDFs mit jina.ai API kostenlos in Markdown konvertieren
Wir leben in einer Zeit, in der uns Informationen praktisch aus jeder Ecke des Internets entgegenströmen. Manchmal fühlt es sich an, als ob man versucht, Wasser aus einem reißenden Fluss zu schöpfen – es ist einfach überwältigend. Gerade, wenn wir mit Large Language Models…
Sonoya Redaktion
Web & CodeTestsieger: Die besten Forum-Plugins für WordPress
Ein Diskussions-Forum auf Deiner WordPress-Seite kann die Interaktion unter Deinen Nutzern fördern und hilft, eine Community aufzubauen. Egal ob Du eine Plattform für Support, einen Raum für Diskussionen oder ein Themen-Forum einrichten möchtest, WordPress bietet eine Vielzahl…
Sonoya Redaktion
Web & CodeErstelle beeindruckende Online-Präsentationen mit reveal.js – So geht’s kostenlos, flexibel und einfach
Hast Du genug von den üblichen Präsentationen mit Microsoft's PowerPoint oder Google Slides? Möchtest Du mal etwas anderes ausprobieren, etwas Kreatives und Dynamisches? Dann lass uns mal gemeinsam reveal.js anschauen! Reveal.js ist ein kostenloses, web-basiertes Tool für…
Sonoya Redaktion
Web & CodeGoogle Hacks Teil 3: Lokale Informationen abrufen
Im dritten Teil der Google-Hacks-Serie liegt der Schwerpunkt darauf, wie man lokale Informationen mit Hilfe von Google möglichst einfach abrufen kann.
Sonoya Redaktion
Web & CodeLinux-Anleitung: Erstes Shell Script schreiben zur Systemaktualisierung (Ubuntu)
Die Shell unter Linux schreckt viele Nutzer aufgrund der komplexen Befehle ab. Dabei hat die Shell eine klasse Eigenschaft: Sie lässt sich mit Shellscript auch programmieren und das relativ einfach und so lassen sich u.a. oft benutzte Arbeitsabläufe durch die Eingabe eines…
Sonoya Redaktion