Es ist seit Jahren ein Ärgernis für Forschende: Wenn sie in ihren wissenschaftlichen Arbeiten die Namen von Genen wie dem Membrane associated ring-CH-type finger 1 – kurz MARCH1 – erwähnen, macht die Tabellen-Software Microsoft Excel daraus kurzerhand ein Datum: den 1. März. Das gleiche passiert bei Gen-Namen wie DEC1 und SEPT1.
Wie weitreichend dieses Problem ist, hat nun eine Studie von Mandhri Abeysooriya von der Deakin University in Australien untersucht. Bei insgesamt 11.117 analysierten Arbeiten wurden in 3.436 – also in 30,9 Prozent – Gennahmenfehler gefunden, erklären die Forschenden im Fachjournal "Plos Computational Biology". In einer vorhergehenden Untersuchung ging man noch von einem tieferen Wert – um die 20 Prozent – aus.
Die Autokorrektur ist heutzutage Bestandteil vieler Messaging-Apps sowie von Text- und Tabellen-Software. Manchmal sorgen Autokorrekturfehler dafür, dass Informationen auf unerwünschte und sogar lustige Weise verzerrt werden. "Nicht lustig ist , wenn wissenschaftliche Tabellen unter der automatischen Umwandlung von Gennamen in Datumsangaben leiden", schreiben die Forschenden in ihrem Bericht.
Bekannt ist das Problem eigentlich schon seit 2014. Microsoft hat bisher auf Anfragen von Forscherinnen und Forschern nicht reagiert, sagen diese. Deshalb wurde das Problem anderweitig angegangen. So hat das Hugo Gene Nomenclature Committee (HGNC) im letzten Jahr kurzerhand dutzende Gennamen umbenannt. Anstatt MARCH1 gibt es nun MARCHF1, anstatt SEPT1 heißt es SEPTIN1. Die Forschenden gehen davon aus, dass die Namensänderungen das Problem seither verringert haben dürften.
Aus der Welt geschafft sei es damit aber nicht. Denn es sei hier nur um die Gene des Menschen, von Mäusen und Ratten gegangen. Gene von anderen Tieren könnten weiterhin ungewollte Umwandlungen auslösen, schreibt Heise.de. Die Forschenden warnen ihre Kolleginnen und Kollegen davor, das Excel-Programm weiterhin zu nutzen.
"Es sind große Veränderungen in der Art und Weise nötig, wie Genomforscher die Daten analysieren und austauschen", schreiben sie. Sie raten den Wissenschaftlerinnen und Wissenschaftlern, die sich mit der Thematik auseinandersetzen dazu, die Programmiersprachen Python und R für Tabellen zu nutzen oder die Software Libreoffice. Damit soll das Problem nicht auftreten.