Ngo, Richard; Chan, Lawrence; Mindermann, Sören: The alignment problem from a deep learning perspective. arXiv, 22.2.2023. arXiv. Viitattu 1.10.2023. (englanniksi)
Carlsmith, Joseph: Is Power-Seeking AI an Existential Risk?". arXiv, 16.6.2022. Artikkelin verkkoversio. Viitattu 1.10.2023. (englanniksi)
mlr.press
proceedings.mlr.press
Langosco, Lauro Langosco Di; Koch, Jack; Sharkey, Lee D.; Pfau, Jacob; Krueger, David: Goal Misgeneralization in Deep Reinforcement Learning. Proceedings of the 39th International Conference on Machine Learning, 28.6.2022, s. 12004–12019. International Conference on Machine Learning. Konferenssijulkaisun verkkoversio. Viitattu 1.10.2023. (englanniksi)
neurips.cc
proceedings.neurips.cc
Zhuang, Simon; Hadfield-Menell, Dylan: Consequences of Misaligned AI. Advances in Neural Information Processing Systems, 2020, 33. vsk, s. 15763–15773. Curran Associates. Artikkelin verkkoversio. Viitattu 1.10.2023. (englanniksi)
pearson.com
Russell, Stuart J.; Norvig, Peter: Artificial intelligence: A modern approach, s. 31–34. Pearson, 2020. ISBN 978-1-292-40113-3Teoksen verkkoversio Viitattu 1.10.2023. (englanniksi)
penguinrandomhouse.com
Russell, Stuart J.: Human compatible: Artificial intelligence and the problem of control. Penguin Random House, 2020. ISBN 9780525558637Kustantajan verkkosivu Viitattu 1.10.2023. (englanniksi)
web.archive.org
Christian, Brian: The alignment problem: Machine learning and human values. W. W. Norton & Company, 2020. ISBN 978-0-393-86833-3Kustantajan verkkosivu Viitattu 1.10.2023. (englanniksi) (Arkistoitu – Internet Archive)
wwnorton.co.uk
Christian, Brian: The alignment problem: Machine learning and human values. W. W. Norton & Company, 2020. ISBN 978-0-393-86833-3Kustantajan verkkosivu Viitattu 1.10.2023. (englanniksi) (Arkistoitu – Internet Archive)