Спасибо )
Буфер под строку 128 байт.
Я бармалеевский метод применил ) точнее Бармалей подсказал в каком месте я затупил.
На самом деле, тут можно посчитать такты... предполагаю что мой пример, возможно, на коротких массивах будет работать чуть быстрее. Но опять же надо пробовать