Wissenschaftliche texte herunterladen

Die Lesbarkeit einzelner Abstracts wurde formal im Verhältnis zum Jahr der Veröffentlichung unter Verwendung eines linearen Mixed-Effects-Modells mit Journal als Zufallseffekt für beide Kennzahlen bewertet. Der feste Effekt des Jahres stand in erheblichem Zusammenhang mit den FR- und NDC-Werten (Tabelle 1). Die durchschnittlichen jährlichen Trends in Kombination mit diesem statistischen Modell zeigen, dass die Komplexität des wissenschaftlichen Schreibens mit der Zeit zunimmt. Um zu untersuchen, ob dieser Trend in allen 12 ausgewählten Feldern konsistent war, extrahierten wir die Steigungen (zufällige Effekte) aus den Gemischten Effektmodellen für jedes Journal. Dies zeigte, dass der Trend der abnehmenden Lesbarkeit im Laufe der Zeit nicht spezifisch für ein bestimmtes Feld ist, obwohl es Unterschiede in der Größe zwischen den Feldern gibt (Abbildung 3). Darüber hinaus zeigten nur zwei von 123 Zeitschriften einen deutlichen Anstieg der FRE im Zeitdurchlauf (Abbildung 3 – Abbildung Beilage 1). Die zunehmende Verwendung von wissenschaftlichem Jargon erschwert die Lektüre wissenschaftlicher Texte. (A) Schematisch, der die wichtigsten Schritte in der Volltextextraktions- und Analysepipeline darstellt. (B) Beziehung zwischen Flesch Reading Ease (FRE) Partituren von Abstracts und Volltexten im Volltextkorpus, dargestellt durch eine zweidimensionale Kerneldichteschätzung. Die Farbskala ist exponentiell und stellt die Anzahl der Artikel an jedem Pixel dar. Achsengrenzwerte werden auf mindestens 99 % der Daten festgelegt. Für neue Dale-Chall(NDC)-Scores siehe Abbildung 4 – Abbildung s. 1.

Für jedes Journal einzeln siehe Abbildung 4 – Abbildung bei 2. Eine geringere Lesbarkeit ist auch ein Problem für Spezialisten (Hartley, 1994; Hartley und Benjamin, 1998; Hartley, 2003). Dies wurde ausdrücklich von Hartley (1994) gezeigt, der demonstrierte, dass das Umschreiben wissenschaftlicher Abstracts, um ihre Lesbarkeit zu verbessern, die Fähigkeit der Akademiker, sie zu verstehen, erhöht. Obwohl wissenschaft komplex ist und ein gewisser Jargon unvermeidbar ist (Knight, 2003), rechtfertigt dies nicht den anhaltenden Trend, den wir gezeigt haben. Es lohnt sich auch, die Bedeutung der Verständlichkeit wissenschaftlicher Texte im Lichte der jüngsten Kontroverse über die Reproduzierbarkeit der Wissenschaft zu bedenken (Prinz et al., 2011; McNutt, 2014; Begley und Ioannidis, 2015; Nosek et al., 2015; Camerer et al., 2016). Die Reproduzierbarkeit setzt voraus, dass die Ergebnisse unabhängig überprüft werden können. Um dies zu erreichen, muss die Berichterstattung über Methoden und Ergebnisse ausreichend verständlich sein. Lesbarkeitsformeln sind nicht ohne Einschränkungen. Sie geben eine Schätzung der Lesbarkeit eines Textes und sollten nicht als kategorisches Maß dafür interpretiert werden, wie gut ein Text verstanden wird. Beispielsweise kann die Lesbarkeit durch Textgröße, Zeilenabstand, die Verwendung von Headern sowie durch die Verwendung visueller Hilfsmittel wie Tabellen oder Diagramme beeinflusst werden, von denen keines durch Lesbarkeitsformeln erfasst wird (Hartley, 2013; Badarudeen und Sabharwal, 2010). Viele semantische Eigenschaften von Texten werden übersehen, einschließlich der Komplexität der Ideen, der rhetorischen Struktur und der Gesamtkohärenz des Textes (Bruce et al., 1981; Danielson, 1987; Zamanian und Heydari, 2012).

Das Ändern eines Textes nur zur Verbesserung der Lesbarkeitsnoten macht einen Text nicht automatisch verständlicher (Duffy und Kabance, 1982; Redish, 2000). Die heuristischen Regeln nach Qualitätskontrollrunden beinhalteten: Entfernen aller Abkürzungen, Hinzufügen von Leerzeichen nach Zeiträumen, wenn sie fehlen, Hinzufügen einer letzten Periode am Ende der Zusammenfassung, wenn sie fehlt, Entfernen von Zahlen, die Sätze beendeten, Identifizieren von Sätzen, die mit “etc.” enden, und Beibehaltung des Zeitraums, Entfernen aller Wörter mit einem Buchstaben außer “a”, “A” und “I”, Entfernen von Nukleinsäuresequenzen, Ersetzen von Bindestrichen durch ein Leerzeichen, Entfernen von Perioden, die sich aus der Verwendung von binomialer Nomenklatur ergeben, und Entfernen von Copyright- und Finanzierungsinformationen. Alle Vorverarbeitungsskripte sind unter github.com/wiheto/readabilityinscience (Plavén-Sigray et al., 2017; Kopie archiviert bei github.com/elifesciences-publications/readabilityinscience) verfügbar. Beispiele für Texte vor und nach der Vorverarbeitung sind in der Zusatzakte 3 dargestellt.

CategoriesUncategorized