Masami Nakamura, Kiyohiro Shikano: A study of English word category prediction based on neural networks. In: Journal of the Acoustical Society of America. Band84, Nr. S1, 1988, S.60–61, doi:10.1121/1.2026400 (aip.org [PDF; 842kB]).
arxiv.org
Stanley Chen, Joshua Goodman: An Empirical Study of Smoothing Techniques for Language Modeling. In: Aravind Joshi, Martha Palmer (Hrsg.): Proceedings of the 34th Annual Meeting of the ACL. Juni 1996 (englisch, arxiv.org [PDF; 227kB]).
Peter Liu, Mohammad Saleh, Etienne Pot, Ben Goodrich, Ryan Sepassi, Łukasz Kaiser, Noam Shazeer: Generating Wikipedia by Summarizing Long Sequences. 2018, S.5, doi:10.48550/arXiv.1801.10198 (arxiv.org [PDF; 1,2MB]).
Yoav Goldberg: Neural Network Methods for Natural Language Processing (= Graeme Hirst [Hrsg.]: Synthesis Lectures on Human Language Technologies. Nr.37). Morgan & Claypool Publishers, 2017, ISBN 978-1-62705-295-5, Chapter 9 Language Modeling, S.105, doi:10.2200/S00762ED1V01Y201703HLT037 (englisch).
Yoav Goldberg: Neural Network Methods for Natural Language Processing (= Graeme Hirst [Hrsg.]: Synthesis Lectures on Human Language Technologies. Nr.37). Morgan & Claypool Publishers, 2017, ISBN 978-1-62705-295-5, Chapter 9 Language Modeling, S.106, doi:10.2200/S00762ED1V01Y201703HLT037 (englisch).
Yoav Goldberg: Neural Network Methods for Natural Language Processing (= Graeme Hirst [Hrsg.]: Synthesis Lectures on Human Language Technologies. Nr.37). Morgan & Claypool Publishers, 2017, ISBN 978-1-62705-295-5, Chapter 9 Language Modeling, S.107, doi:10.2200/S00762ED1V01Y201703HLT037 (englisch).
Masami Nakamura, Kiyohiro Shikano: A study of English word category prediction based on neural networks. In: Journal of the Acoustical Society of America. Band84, Nr. S1, 1988, S.60–61, doi:10.1121/1.2026400 (aip.org [PDF; 842kB]).
Yoav Goldberg: Neural Network Methods for Natural Language Processing (= Graeme Hirst [Hrsg.]: Synthesis Lectures on Human Language Technologies. Nr.37). Morgan & Claypool Publishers, 2017, ISBN 978-1-62705-295-5, Chapter 9 Language Modeling, S.109, doi:10.2200/S00762ED1V01Y201703HLT037 (englisch).
Yoshua Bengio, Réjean Ducharme, Pascal Vincent, Christian Janvin: A neural probabilistic language model. In: Journal of Machine Learning Research. Band3, 2003, ISSN1532-4435, S.1137–1155, doi:10.1007/10985687_6 (neurips.cc [PDF; 1,6MB]).
Yoav Goldberg: Neural Network Methods for Natural Language Processing (= Graeme Hirst [Hrsg.]: Synthesis Lectures on Human Language Technologies. Nr.37). Morgan & Claypool Publishers, 2017, ISBN 978-1-62705-295-5, Chapter 9 Language Modeling, S.109-, doi:10.2200/S00762ED1V01Y201703HLT037 (englisch).
Yoav Goldberg: Neural Network Methods for Natural Language Processing (= Graeme Hirst [Hrsg.]: Synthesis Lectures on Human Language Technologies. Nr.37). Morgan & Claypool Publishers, 2017, ISBN 978-1-62705-295-5, Chapter 9 Language Modeling, S.112, doi:10.2200/S00762ED1V01Y201703HLT037 (englisch).
Gerhard Paaß, Sven Giesselbach: Pre-trained Language Models. In: Foundation Models for Natural Language Processing. Springer International Publishing, Cham 2023, ISBN 978-3-03123189-6, S.19–78, hier: S. 41, doi:10.1007/978-3-031-23190-2_2 (englisch).
Peter Liu, Mohammad Saleh, Etienne Pot, Ben Goodrich, Ryan Sepassi, Łukasz Kaiser, Noam Shazeer: Generating Wikipedia by Summarizing Long Sequences. 2018, S.5, doi:10.48550/arXiv.1801.10198 (arxiv.org [PDF; 1,2MB]).
Yoav Goldberg: Neural Network Methods for Natural Language Processing (= Graeme Hirst [Hrsg.]: Synthesis Lectures on Human Language Technologies. Nr.37). Morgan & Claypool Publishers, 2017, ISBN 978-1-62705-295-5, Chapter 9 Language Modeling, S.105, doi:10.2200/S00762ED1V01Y201703HLT037 (englisch, insbesondere Fußnote 2).
neurips.cc
proceedings.neurips.cc
Yoshua Bengio, Réjean Ducharme, Pascal Vincent, Christian Janvin: A neural probabilistic language model. In: Journal of Machine Learning Research. Band3, 2003, ISSN1532-4435, S.1137–1155, doi:10.1007/10985687_6 (neurips.cc [PDF; 1,6MB]).
Ashish Vaswani, Noam Shazeer, Niki Parmar, Jakob Uszkoreit, Llion Jones, Aidan Gomez, Łukasz Kaiser, Illia Polosukhin: Attention Is All You Need. In: 31st Conference on Neural Information Processing Systems. 2017 (neurips.cc [PDF; 556kB]).
openai.com
cdn.openai.com
Alec Radford, Karthik Narasimhan, Tim Salimans, Ilya Sutskever: Improving Language Understanding by Generative Pre-Training. 2018, S.4 (openai.com [PDF; 528kB]).
uni-leipzig.de
informatik.uni-leipzig.de
Wie meistens in der modernen Informatik ist auch hier die englische Bezeichnung präsenter. Die deutsche Bezeichnung Sprachmodell findet sich beispielhaft in:
Franziska Meyer: Sprachmodelle im Natural Language Processing. Seminararbeit an der Universität Leipzig. 2020 (uni-leipzig.de [PDF; 344kB]).
zdb-katalog.de
Yoshua Bengio, Réjean Ducharme, Pascal Vincent, Christian Janvin: A neural probabilistic language model. In: Journal of Machine Learning Research. Band3, 2003, ISSN1532-4435, S.1137–1155, doi:10.1007/10985687_6 (neurips.cc [PDF; 1,6MB]).