The story behind tailorpost- why and how?

Thomas Niederl
Aug 9, 2020 · 2 min read

Durch die permanente Informationsüberflutung wird es immer schwieriger die Informationen zu bekommen, die man wirklich benötigt und die einen interessieren. Aus diesem Anlass wurde tailorpost gegründet, um vetrauenswürdige bzw. qualitative Quellen zu finden und diese anhand meiner Interessen aufzubereiten.

über 400 deutschsprachige online Zeitungen, unzählige Wochenzeitschriften, Magazine, >500 Mio. Tweets auf twitter pro Tag, …..

Bei tailorpost werden 19 unterschiedliche Informationsquellen (online freizugängliche Nachrichtenportale), welche sich dem österr. Pressekodex verpflichtet haben, gecrawlt. Dabei werden ca. 2.500 Artikel pro Tag erfasst, analysiert, zu Themenereignissen gruppiert, über den Qualitätsscore bewertet und anschließend als News Stream auf die individuellen Bedürfnisse (Zeit, Ort, Beruf, Freizeit, etc.) zugeschnitten.

tailorpost arbeitet mit neuesten machine learning und natural language processing (NLP) Methoden und verwendet dabei Clustering mittels unsupervised learning und Classification mittels supervised learning. In der Entwicklung der Algorithmen wurden mehrere Clustermethoden ausprobiert und ein vielversprechender Ansatz mit word2vec in Kombination mit hdbscan gefunden. Hier wurde als trainings model ein Datensatz mit über 2.5mio Artikeln verwendet. Diese Daten fungieren als Referenzmodell um das Clustering sicherzustellen. Zur Erfassung der Kategorie wird guided LDA verwendet. Durch eine Optimierung des Preprocessings wurde hier eine weitere Verbesserung beobachtet. Mit Hilfe des Zusammenspiels der beiden Methoden konnten wir eine sehr gute Aufbereitung der Daten erreichen. Diese ist ein sehr guter Ausgangspunkt für die Bewertung der einzelnen Artikel hinsichtlich Qualität. Der Qualitätsscore wurde durch mehrere Umfragen verbessert und weitere Qualitätsmerkmale wurden gefunden und in Algorithmen zur Bewertung (Ranking 0–10) umgesetzt.

Qualitätsscore

Gerne geben wir unser Wissen in NLP, machine learning, company building, Förderungen etc. weiter. Schreibt uns dazu einfache eine Mail an office@tailorpost.com
Code (Python) und Daten sind als open Source zu bekommen.

Eine Technische Feasability Study für das Projekt kann als Whitepaper abgerufen werden.

tailorpost

Transparent.

Thomas Niederl

Written by

Founder and CVO at tailorpost

tailorpost

Transparent. Unabhängig. Individuell. Wir haben uns zum Ziel gesetzt, den Journalismus und die Medien wieder vertrauenswürdig zu machen. Dabei steht die objektive Berichterstattung im Vordergrund und nicht die politische oder wirtschaftliche Beeinflussung.

Thomas Niederl

Written by

Founder and CVO at tailorpost

tailorpost

Transparent. Unabhängig. Individuell. Wir haben uns zum Ziel gesetzt, den Journalismus und die Medien wieder vertrauenswürdig zu machen. Dabei steht die objektive Berichterstattung im Vordergrund und nicht die politische oder wirtschaftliche Beeinflussung.

Medium is an open platform where 170 million readers come to find insightful and dynamic thinking. Here, expert and undiscovered voices alike dive into the heart of any topic and bring new ideas to the surface. Learn more

Follow the writers, publications, and topics that matter to you, and you’ll see them on your homepage and in your inbox. Explore

If you have a story to tell, knowledge to share, or a perspective to offer — welcome home. It’s easy and free to post your thinking on any topic. Write on Medium

Get the Medium app

A button that says 'Download on the App Store', and if clicked it will lead you to the iOS App store
A button that says 'Get it on, Google Play', and if clicked it will lead you to the Google Play store