In 125 all_text2 Out 125 u0422 u0430 u043a u0432 u043e u0442 u044f u04

 1
 2
 3
 4
 5
 6
 7
 8
 9
10
11
12
13
In [125]: all_text2
Out[125]: u'\r\n\u0422\u0430\u043a \u0432\u043e\u0442 \u044f \u043d\u0435 \u043f\u043e\u043d\u0438\u043c\u0430\u044e, \u0437\u0430\u0447\u0435\u043c \u044d\u0442\u043e \u0434\u0435\u043b\u0430\u0442\u044c \u0442\u0430\u043c, \u0433\u0434\u0435 \u044d\u0442\u043e \u043d\u0435 \u0438\u0441\u043f\u043e\u043b\u044c\u0437\u0443\u0435\u0442\u0441\u044f. \u0414\u0430\u0436\u0435 \u043f\u0440\u0438 \u0438\u0441\u043f\u043e\u043b\u044c\u0437\u043e\u0432\u0430\u043d\u0438\u0438 \u0440\u0435\u043b\u044f\u0442\u0438\u0432\u043d\u043e\u0441\u0442\u0438 \u044d\u0442\u0438 \u0438\u043d\u0434\u0435\u043a\u0441\u044b \u0431\u044b\u0432\u0430\u044e\u0442 \u043d\u0435 \u043d\u0443\u0436\u043d\u044b.qqwewewe\r\n\r\ndumpz:5502\r\n\r\nqerwwer'
In [126]: print(all_text2)
Так вот я не понимаю, зачем это делать там, где это не используется. Дажепри использовании релятивности эти индексы бывают не нужны.qqwewewe
dumpz:5502
qerwwer
In [127]: re.split(r'\W+',all_text2, re.U)
Out[127]: [u'', u'qqwewewe', u'dumpz', u'5502', u'qerwwer']