Turistični korpus TURK je elektronska zbirka turističnih besedil v slovenskem, italijanskem in angleškem jeziku, oblikovana na osnovi statistično relevantnih kriterijev in z nizom pomožnih jezikovnih orodij.
Nastal je v okviru temeljnega raziskovalnega projekta »Večjezični korpus turističnih besedil – informacijski vir in analitična baza slovenske naravne in kulturne dediščine« izvajalca UP ZRS, financerja ARRS in nosilke dr. Vesne Mikolič v letih 2006–2008. Zajel je dokumente, nastale od osamosvojitve Slovenije dalje do konca projekta v letu 2008. Podatki o prvi izdaji TURK1:
Število besed: 21.963.566.
Število dokumentov: 11.516.
Do nadgradnje korpusa TURK z vključitvijo dokumentov po letu 2008 je prišlo v okviru dveh projektov, in sicer v okviru temeljnega raziskovalnega projekta »Slovenska nacionalna identiteta v luči turističnega diskurza« izvajalca UP ZRS, partnerjev UP FHŠ, UL FF in UM FF, financerja ARRS in nosilke dr. Vesne Mikolič v letih 2014–2016 ter v okviru projekta “Turistična terminologija na področjih dediščine in pomorstva” programa Po kreativni poti do praktičnega znanja, ki ga je financiralo Ministrstvo RS za izobraževanje, znanost in šport, izvajali pa mentorji in študentje UP FHŠ, UP FTŠ Turistica, podjetja za pomorske in transportne storitve NAVTIK in Turistično gostinske zbornice Slovenije v času od 9. 2. 2015 do 31. 7. 2015. Podatki o drugi izdaji TURK2:
Število besed: 9.149.691.
Število dokumentov: 5.271.
Tako je današnje stanje korpusa TURK, ki vsebuje TURK1 in TURK2, naslednje: