Ralf Hohoff

Regular Expression für Wildcards in pdi

In einigen Transformations- und Jobschritten, insbesondere die die Handhabung von Dateien umsetzen, gibt es die Möglichkeit, Wildcards anzugeben. Aber natürlich gleich in der mächtigen Variante: Wildcard als Regulärer Ausdruck (Regular Expression)!

Wie es geht wird auf How to process a Kettle transformation once per filename beschrieben

The correct regex to get all files whose extension is .xml is ”.*\.xml”. This isn’t a regex tutorial, go look that up on the web.

Bitte die Anführungszeichen nicht mit angeben, für Excel-Dokumente lautet das z.B.  „.*\.xlsx“ oder „.*\.xlsx$“, wenn man das konkret auf das Zeilen- oder Stringende prüfen will.

Hilfreich bei der Erstellung von Regulären Ausdrücken ist auch der Online Regular Expression Builder

Einlesen von Verzeichnissen

Auch dasEinlesen von Verzeichnissen nutzt reguläre Ausdrücke, nachfolgend ein Beispiel mit der Transformation Get File Names

 

How to process a Kettle transformation once per filename

Küche unter Strom – ETL-Prozesse à la carte mit Pentaho Data Integration (Open Source)

Auch in Zeiten der IT-Konsolidierung und SOA stehen Entwickler und Administratoren täglich vor der Herausforderung, Daten direkt von einem in das andere System zu überführen oder strukturierte Im- und Exporte in verschiedenen Formaten bereitzustellen. Doch wie entwickelt man kostengünstig eine fexible und dauerhaft wartbare Lösung für diese Aufgaben?

Erschienen im Entwickler Magazin 3/2010 und steht hier zum Download zur Verfügung.