Feature-based detection of automated language models: Tackling GPT-2, GPT-3 and Grover

Downloadstatistik des Dokuments (Auswertung nach COUNTER):

Fröhling, L.; Zubiaga, A.: Feature-based detection of automated language models: Tackling GPT-2, GPT-3 and Grover. In: PeerJ Computer Science 7 (2021), e443. DOI: https://doi.org/10.7717/peerj-cs.443

Version im Repositorium

Zum Zitieren der Version im Repositorium verwenden Sie bitte diesen DOI: https://doi.org/10.15488/15750

Zeitraum, für den die Download-Zahlen angezeigt werden:

Jahr: 
Monat: 

Summe der Downloads: 21




Kleine Vorschau
Zusammenfassung: 
The recent improvements of language models have drawn much attention to potential cases of use and abuse of automatically generated text. Great effort is put into the development of methods to detect machine generations among human-written text in order to avoid scenarios in which the large-scale generation of text with minimal cost and effort undermines the trust in human interaction and factual information online. While most of the current approaches rely on the availability of expensive language models, we propose a simple feature-based classifier for the detection problem, using carefully crafted features that attempt to model intrinsic differences between human and machine text. Our research contributes to the field in producing a detection method that achieves performance competitive with far more expensive methods, offering an accessible “first line-of-defense” against the abuse of language models. Furthermore, our experiments show that different sampling methods lead to different types of flaws in generated text.
Lizenzbestimmungen: CC BY 4.0 Unported
Publikationstyp: Article
Publikationsstatus: publishedVersion
Erstveröffentlichung: 2021
Die Publikation erscheint in Sammlung(en):Wirtschaftswissenschaftliche Fakultät

Verteilung der Downloads über den gewählten Zeitraum:

Herkunft der Downloads nach Ländern:

Pos. Land Downloads
Anzahl Proz.
1 image of flag of Germany Germany 10 47,62%
2 image of flag of United States United States 5 23,81%
3 image of flag of Japan Japan 1 4,76%
4 image of flag of Indonesia Indonesia 1 4,76%
5 image of flag of Europe Europe 1 4,76%
6 image of flag of Estonia Estonia 1 4,76%
7 image of flag of Switzerland Switzerland 1 4,76%
8 image of flag of Austria Austria 1 4,76%

Weitere Download-Zahlen und Ranglisten:


Hinweis

Zur Erhebung der Downloadstatistiken kommen entsprechend dem „COUNTER Code of Practice for e-Resources“ international anerkannte Regeln und Normen zur Anwendung. COUNTER ist eine internationale Non-Profit-Organisation, in der Bibliotheksverbände, Datenbankanbieter und Verlage gemeinsam an Standards zur Erhebung, Speicherung und Verarbeitung von Nutzungsdaten elektronischer Ressourcen arbeiten, welche so Objektivität und Vergleichbarkeit gewährleisten sollen. Es werden hierbei ausschließlich Zugriffe auf die entsprechenden Volltexte ausgewertet, keine Aufrufe der Website an sich.