Breadcrumbs
- Data Science and Artificial Intelligence¹
- Projekte
- Augmentext: eine Textaugmentationsbibliothek
Augmentext: eine Textaugmentationsbibliothek
Medizinische Datenaugmentation
Das Projekt Augmentext entwickelte eine neuartige Textaugmentationsbibliothek für Python, die Augmentation für medizinische Daten ermöglicht. Datenaugmentation ist ein Prozess, bei dem zusätzliche Daten aus bereits existierenden Daten generiert werden.
Erhöhte Vielfalt und Leistung
Durch das Generieren von Varianten bestehender Texte können mehr Beispiele für verschiedene Nuancen und Formulierungen geschaffen werden. Das hilft, die Vielfalt im Trainingsdatensatz für Machine Learning Anwendungen zu erhöhen. Durch die Textaugmentation werden mehr unterschiedliche Kontexte und Ausdrücke abgedeckt, was die Modell-Leistung verbessern kann.