2
#! /usr/bin/python
# coding=utf-8
import re
f = open('dir.txt')
a = f.read()
t = re.findall(r'\[(.+?)\]', a)

Вытаскиваю названия папок из текстового документа, получаю массив. Когда в названии папки попадается кириллица получается вот это

['Games', 'Intel', 'PerfLogs', 'Program Files', 'Program Files (x86)', 'Python27', 'Python273', 'radare2', 'Users', 'Windows', '\xd1\x82\xd0\xb5\xd1\x81\xd1\x82 \xd1\x82\xd0\xb5\xd1\x81\xd1\x82']

Подскажите пожалуйста, в чем проблема?

insolor
  • 49,104
test
  • 29
  • 1
    Укажите версию Python. Я предполагаю, что версия Python 2, и проблема специфична именно для него. Для Python 3 будет другая проблема, и решать ее нужно будет по-другому. – insolor Jan 06 '20 at 17:22

1 Answers1

1

Строку надо декодировать в UTF-8:

>>> b'\xd1\x82\xd0\xb5\xd1\x81\xd1\x82\xd1\x82\xd0\xb5\xd1\x81\xd1\x82'.decode("utf-8")
'тест тест'