MasaTalet på mulige URLar som genererast dynamisk fra serverprogram gjer det vanskelig for roboten å unngå å lasta ned duplikat av sider han allereie har vitja. Sjølv om W3C åtvarar mot å nytta meir enn 255 byte i ein HTTP GET førespurnad[2], svarar til det 256^{256} \approx 3,2 \times 10^{616} sider som kan genererast, og ein kan derfor ikkje gjetta seg til gyldige GET-førespurnadar. I tillegg kan same innehald lenkjast til på fleire forskjellige måtar. Til dømes kan ei vevsapplikasjon som serverer nyheitsmeldingar frå forskjellige årstal tilby eit felt for årstal, og eit felt for svartype. Om du då spesifiserer example.com/?årstal=2000&datatype=XML er dette nøyaktig det same som å spesifisera example.com/?datatype=XML&årstal=2000. Då får du eit problem når same informasjon kan lenkjast på forskjellige måtar, og hyperkoplingane dermed ikkje lengre peikar til unikt innhald.nès, Julien (15. februar 2007). Web Archiving. Springer. s. 1. ISBN978-3-54046332-0. Henta 5. april 2014. CS1 maint: Multiple names: authors list (link)
Cothey, Viv (2004). «Web-crawling reliability». Journal of the American Society for Information Science and Technology55 (14): 1228–1238. doi:10.1002/asi.20078.
Cho, J.; Garcia-Molina, H.; Page, L. (April 1998). «Efficient Crawling Through URL Ordering». Seventh International World-Wide Web Conference (Brisbane, Australia).
Pant, Gautam; Srinivasan, Padmini; Menczer, Filippo (2004). «Crawling the Web»(PDF). I Levene, Mark; Poulovassilis, Alexandra. Web Dynamics: Adapting to Change in Content, Size, Topology and Use. Springer. s. 153–178. ISBN978-3-540-40676-1. Arkivert frå originalen(PDF) 20. mars 2009. Henta 22. mars 2009.
Pant, Gautam; Srinivasan, Padmini; Menczer, Filippo (2004). «Crawling the Web»(PDF). I Levene, Mark; Poulovassilis, Alexandra. Web Dynamics: Adapting to Change in Content, Size, Topology and Use. Springer. s. 153–178. ISBN978-3-540-40676-1. Arkivert frå originalen(PDF) 20. mars 2009. Henta 22. mars 2009.