30. März 2026
RNA Sekundärstrukturvorhersage mit Hilfe eines Transformator-Encoder
Marcel Arian Hadi, Peregrin Wahle
Die Vorhersage der RNA-Sekundärstruktur aus einer Nukleotidsequenz ist ein wichtiges Problem in der Rechenbiologie. In dieser Arbeit untersuchen wir die Aufgabe, RNA-Sequenzen mit einem Transformator-Encodermodell zu Punkten-Braket-sekundären Strukturrepräsentationen umzuwandeln. Wir bewerten systematisch mehrere Modellkonfigurationen und Trainingsinstellungen und beurteilen ihre Leistung sowohl anhand von Token-Niveau als auch strukturbewussten Metriken, einschließlich des genauen Übereinstimmens auf Sequenzebene, gepaarter F1-Score und struktureller Gültigkeit. Darüber hinaus analysieren wir die Auswirkungen einfacher Postverarbeitungsstrategien zur Korrektur ungültiger Strukturen und führen eine nachgelagerte Struktur-Levelanalyse durch basierend auf den reparierten Punkt-Brakett-Ausgaben. Unsere Ergebnisse zeigen, dass Transformer-Encoder in der Lage sind, relevante Strukturmuster in RNA-Sequenzungen zu erfassen, aber dass Token-Bewusstsein für die Her