Но она же должна быть у каждого процесса своя? Или как?
И при межстраничном вызове (из процесса в ядро) копироваться из страницы процесса в страницу ядра. Или как вариант, в общей памяти должно лежать столько udata-ов, сколько процессов в ОЗУ, каждый из процессов пишет в свою по вычисляемому указателю, и при переключении контекста ядро будет брать нужную UDATA по указателю, вычисляемому в зависимости от того в какой 60-к страничке сейчас выполняется код процесса (чтобы избежать межстраничного копирования). Правда не известно что быстрее: скопировать 119 байт между страниц, или работать по указателю и в процессе и в ядре.