Archiv der Kategorie: Datenimport

Power Query(#019): PDF in Excel einlesen! Top oder Flop?

Zunächst gab es Gerüchte… das unter Controllern verpönte, aber leider oft abgelieferte Dateiformat PDF könne vielleicht… eines Tages… in PowerBI eingelesen werden. Eines Tages war dann plötzlich die Möglichkeit da, den Connector zu PDF in PowerBI zu nutzen, aber nur als Vorschau-Feature… in einem bestimmten Update Kanal… wenn man es extra aktivierte… Dann war es endlich soweit: PDF-Connector für PowerBI! Für alle! Einfach im Menü! Aber eben leider nur in PowerBI, nicht in Excel.

In meinen Seminaren habe ich immer wieder darauf hingewiesen, dass Power Query (PQ) in PowerBI und PQ in Excel zwar funktional etwa dasselbe leisten, sehr ähnlich aussehen,dann aber manchmal bei der Funktionssyntax und vor allem in den Datenquellen große Unterschiede aufweisen, da – man kann es kaum glauben – dies zwei völlig unterschiedliche Produkte sind! Es sind auch zwei unterschiedliche Entwicklerteams in Redmont mit der Entwicklung beauftragt. Ich habe jedoch die Hoffnung nie aufgegeben, dass auch PQ in Excel diesen PDF-Connector bekommen könnte, da schon viele der Features von PQ für PowerBI erhalten hat. Zwar immer zeitverzögert, aber immerhin.

Und nun ist er da: der Connector zu PDF für Power Query in Excel! Leider nur, wenn Sie ein Office365 Abonnement haben… die neuesten Updates haben…

An einer einfachen Beispieldatei sehen Sie, wie dies funktioniert. Leider sind in Power Query die Pfade von Haus aus absolut, sodass Sie diese in Ihrer Umgebung zunächst anpassen müssen.

Falls Sie selbst mit dem PDF-Connector experimentieren wollen, dann starten Sie über Daten abrufen und transformieren / aus Datei / aus PDF …

Ein wenig holprig ist die Implementierung dennoch.

  • Mehrseitige Dokumente müssen oft als Einzelseiten importiert und wieder zusammengefügt werden, speziell wenn Seitenköpfe ausgegeben werden. Was ja in PDF leider üblich ist. Hierzu kann man sich mit einem ähnlichen Ansatz wie beim Ordner auslesen selbst eine Lösung programmieren, aber muss dazu erheblichen Aufwand betreiben und braucht das entsprechende Knowhow in M-Programmierung. Möglich aber, dass dies mit einem Update noch automatisiert wird. Stimmen Sie für unseren Vorschlag auf Excel Uservoice!
  • Manche PDF-Dokumente sind intern seitenweise unterschiedlich aufgebaut! Warum dies so ist, entzieht sich völlig meinem Verständnis, aber für den Zweck von PDF reicht gutes Aussehen aus. Wenn Sie aber – wie ich – auf’s Innere achten, dann verhindert dieser Umstand die automatisierte Weiterverarbeitung der Daten – aber dafür ist PDF auch nicht gedacht! Ich werde nicht müde von meinen Kunden zu fordern: lassen Sie sich die Daten in einen vernünftigen tabellarischen Format geben! Ob TXT, CSV, XLSX oder irgendein Format… Egal! Hauptsache kein PDF! Zwar habe ich nun rein technisch eine Möglichkeit, diese Daten einzulesen und diese werden viele auch nutzen. Organisatorisch bin ich trotzdem noch kein PDF-Fan…

Top oder Flop? Ich bin für Top, wenn sich manchmal ein Import aus PDF nicht umgehen lässt, aber es ist immer noch Topper, eine direkte Verbindungen zur Quelldatenbank aufzubauen.

PS Meine Hoffnung auf PDF für PowerQuery wurde also erhört. Die Hoffnung auf Power Query für Access – lediglich für den Datenimport, nicht die Datenmanipulation – gebe ich jedoch bald auf. Mein Verbesserungsvorschlag auf Access Uservoice gehörte damals zu den am höchst bewerteten Beiträgen und wurde doch von Microsoft doch abgelehnt: no current plan… 🙁

——————————————————————————————————————————-

Wenn Ihnen dieser Beitrag gefallen hat, dann teilen  Sie ihn gerne. Falls Sie Anmerkungen haben, schreiben Sie bitte einen Kommentar, oder senden Sie mir eine Mail an info@prt.de.

Access als Datensammler – die Single Source of Truth

Viel Jahre sah der übliche Daten-Aufbereitungsprozess für Controller immer gleich aus:

Vorsysteme wie SAP liefern Daten als Export in Form von Text-, CSV- oder Excel-Dateien. Diese wurden dann in mehr oder weniger aufwändigen Verfahren aufbereitet, um saubere Listen zu bekommen, die dann in Excel gespeichert wurden. Dies Daten konnten dann mit den verschiedensten Techniken, wie etwa SUMMEWENN, TEILERGEBNIS, PivotTabellen oder Konsolidieren verdichtet und mittels Diagrammen visualisiert werden.

Weiterlesen

Power Query(#004): Text- und Datums-Funktionen ersetzen

Power Query erspart den Einsatz von Text- und Datums-Funktionen in Excel.

Power Query ist seit der Version Excel 2013 das Tool schlechthin, wenn es um Datenimport und -verdichtung (ETL) geht. Im folgenden Beispiel zeigen wir eine Lösung mit Power Query, für die wir früher verschiedene Text- und Datums-Funktionen sowie VBA einsetzen mussten. Aber sehen Sie hier.

So sieht die Datei unmittelbar nach dem Import aus

Weiterlesen

(#003) Live aus dem Projekt: PowerQuery kann keine UNION-Abfragen einbinden!

gerade habe ich in einem Projekt eine schöne UNION-Abfrage in ACCESS formuliert, um zwei Tabellen dynamisch untereinander zu stellen. Zur Erklärung: mit dieser Abfrage kann ich Daten aus zwei Tabellen – auch Excel-Tabellen! – untereinander darstellen, damit sie dann wie eine Tabelle benutzt oder analysiert werden können bspw. in Pivot & Co.

Bisher habe ich diese Abfrage wunderbar mit MS-Query nach Excel verknüpft, um dann eine Pivot-Tabelle darauf aufzusetzen.

Problem im Projekt:

Als bekennender PowerQuery-Fan möchte ich die Daten nun über PowerQuery einbinden.

ABER, oh Schreck! PowerQuery bietet mir bei der Auswahl der verknüpfbaren Datenquellen nur Tabellen und „normale“ Selektionsabfragen an. Aktionsabfragen werden logischerweise ausgelassen, aber leider auch: UNION-Abfragen!

Peters Workaround:

Weiterlesen

Seminar: Reporting mit Excel II – Datenimport

Technisch ist das Problem Daten aus (z.B.) ERP-Systemen nach Excel zu importieren seit Jahren gelöst. Im Detail treten aber doch immer unerwünschte Effekte auf, die mit aufwendigem Nacharbeiten in Excel beseitigt werden müssen. Das liegt zum Teil an  der Struktur der im Vorsystem aufbereiteten Daten, teils am Format, teils an der Verteilung der Daten über mehrere Spalten oder nur in einer Spalte. Zeichen müssen ersetzt, ausgetauscht oder ganz beseitigt (z.B. Leerzeichen) werden. Importierte Stammdaten sollen mit Bewegungsdaten zu Datensätzen verbunden werden oder umgekehrt. Weiterlesen

EXCEL-TIPP: Variable Datenbereiche für Namen, Formeln/Funktionen, Pivot-Tabelle und Diagramme

Worum geht es?

Anwender arbeiten  in Excel viel mit Datenlisten, die irgendeiner Form ausgewertet werden. Dafür verwenden wir Formeln und Funktionen, Pivot-Tabellen oder stellen Ergebnisse durch Diagramm dar. Wird die Datenliste erweitert oder reduziert, müssen wir alle Bezüge anpassen, eine häufige Quelle für Fehler. Weiterlesen

EXCEL-Tipp: Alle leeren Zellen markieren und durch 0 ersetzen

Worum geht es?

Nach der Übernahme von Daten aus dem Primärsystem nach Excel ist häufig festzustellen, dass die Datensätze und Zeichen nicht wie gewünscht in der Excel Tabelle angeordnet werden. Hier kann es die vielfältigsten Überraschungen geben:

  • Datensätze werden in eine Zelle geschrieben
  • Datensätze werden auf zahlreiche Zellen verteilt
  • Formate von Zahlen und Datumsangaben sind nicht numerisch
  • Zahlen haben nachgestellte Minuszeichen
  • u.v.m.

Weiterlesen

EXCEL-Tipp: Führende und nachfolgende Leerzeichen löschen

Worum geht es?

Nach der Übernahme von Daten aus dem Primärsystem nach Excel ist häufig festzustellen, dass die Datensätze und Zeichen nicht wie gewünscht in der Excel Tabelle angeordnet werden. Hier kann es die vielfältigsten Überraschungen geben:

  • Datensätze werden in eine Zelle geschrieben
  • Datensätze werden auf zahlreiche Zellen verteilt
  • Formate von Zahlen und Datumsangaben sind nicht numerisch
  • Zahlen haben nachgestellte Minuszeichen
  • u.v.m.

Das folgende Beispiel stammt aus unserem Seminar Datenimport & -analyse mit EXCEL: Weiterlesen

EXCEL-Tipp: Kontierung mit Null auffüllen

Worum geht es?

Nach der Übernahme von Daten aus dem Primärsystem nach Excel ist häufig festzustellen, dass die Datensätze und Zeichen nicht wie gewünscht in der Excel Tabelle angeordnet werden. Hier kann es die vielfältigsten Überraschungen geben:

  • Datensätze werden in eine Zelle geschrieben
  • Datensätze werden auf zahlreiche Zellen verteilt
  • Formate von Zahlen und Datumsangaben sind nicht numerisch
  • Zahlen haben nachgestellte Minuszeichen
  • u.v.m.

Das folgende Beispiel stammt aus unserem Seminar Dashboards mit EXCEL erstellen
Weiterlesen

EXCEL-Tipp: „Textzahlen“ in eine echte Zahlen umwandeln, Variante 2

Worum geht es?

Nach der Übernahme von Daten aus dem Primärsystem nach Excel ist häufig festzustellen, dass die Datensätze und Zeichen nicht wie gewünscht in der Excel Tabelle angeordnet werden. Hier kann es die vielfältigsten Überraschungen geben:

  • Datensätze werden in eine Zelle geschrieben
  • Datensätze werden auf zahlreiche Zellen verteilt
  • Formate von Zahlen und Datumsangaben sind nicht numerisch
  • Zahlen haben nachgestellte Minuszeichen
  • u.v.m.

Das folgende Beispiel stammt aus unserem Seminar Datenimport & -analyse mit EXCEL: Weiterlesen