unicode

Простой способ удалить акценты из строки Юникода? [дубликат]

этот вопрос уже есть ответ здесь: есть ли способ избавиться от акцентов и преобразовать всю строку в обычные буквы? 9 ответов Я хочу изменить это предложение ...

Должен ли я использовать акцентированные символы в URL-адресах?

при создании веб-контента на языках, отличных от английского, возникает проблема поиска оптимизированных и удобных для пользователя URL-адресов. Мне интересно, является ли лучшей практикой использовать де-акцентированные Буквы в URL-адресах-рискуя, ...

Как сравнить строку Юникода, которая имеет разные байты, но одно и то же значение?

я сравниваю строки Юникода между объектами JSON. Они имеют одинаковое значение: a = '人口じんこうに膾炙かいしゃする' b = '人口じんこうに膾炙かいしゃする' но у них разные представления Юникода: String a : u'\u4eba\u53e3\u3058\u3093\u3053\u3046\u306b\u81be\u7099\u304b\u3044\u3 ...

Java regex для поддержки Unicode?

чтобы сопоставить A с Z, мы будем использовать регулярное выражение: [A-Za-z] Как разрешить регулярное выражение для соответствия utf8 символов, введенных пользователем? Например, китайские слова, такие как 环保部 ...

UnicodeEncodeError: кодек 'ascii' не может кодировать символ под специальным именем [дубликат]

этот вопрос уже есть ответ здесь: UnicodeEncodeError: кодек 'ascii' не может кодировать символ u '\xa0 ' в позиции 20: порядковый номер не в диапазоне (128) 19 ответов ...

Ruby 1.9: как я могу правильно upcase & downcase многобайтовые строки?

Итак, МАЦ принял решение сохранить upcase и downcase ограничен /[A-Z]/i в ruby 1.9.1. ActiveSupport::Multibyte уже давно был большой случай i18n jiggering в ruby 1.8.x через String#mb_chars. однако, при попытке под ruby 1.9.1, это, кажется, не рабо ...

Что мне нужно знать о Unicode?

будучи разработчиком приложений, мне нужно знать Unicode? ...

Как подсчитать символы в строке юникода в C

допустим у меня есть строка: char theString[] = "你们好āa"; учитывая, что моя кодировка utf-8, эта строка имеет длину 12 байт (три символа hanzi-три байта каждый, латинский символ с Макроном-два байта, а " a " - один байт: strlen(theString) == 12 ...

Как я могу получить код символа Юникода?

допустим, у меня есть это: char registered = '®'; или umlaut, или любой другой символ Юникода. Как я мог получить его код? ...

Как вам стр.перевести для работы со строками Юникода?

у меня есть следующий код: import string def translate_non_alphanumerics(to_translate, translate_to='_'): not_letters_or_digits = u'!"#%\'()*+,-./:;<=>?@[\]^_`{|}~' translate_table = string.maketrans(not_letters_or_digits, ...

Замена Python StringIO, которая работает с байтами вместо строк?

есть ли замена для python StringIO класс, который будет работать с bytes вместо струн? это может быть не очевидно, но если вы использовали StringIO для обработки двоичных данных, вам не повезло с Python 2.7 или новее. ...

Unicode через CSS: раньше

Я использую Шрифт Удивительным на моем сайте и я хочу, чтобы отобразить значок внутри :before элемент псевдо. по словам документация / cheatsheet, Я должен типа &#xf066; чтобы получить этот шрифт, но он не работает. Я считаю, что это нормально, ...

Исправление сломанной кодировки UTF8

Я нахожусь в процессе исправления некоторых плохих кодировок UTF8. В настоящее время я использую PHP 5 и MySQL в моей базе данных у меня есть несколько экземпляров плохих кодировок, которые печатают как: î параметры сортировки базы данных utf8_ ...

Список всех открытых / закрытых скобок Юникода?

что такое список всех скобочных символов Юникода (включая, например:{}[]()<>)? Что такое хороший способ поиска символов Юникода? ...

Почему 'U+' используется для обозначения кодовой точки Юникода?

Почему кодовые точки Юникода отображаются как U+<codepoint>? например, U+2202 обозначает символ ∂. Почему бы и нет U- (тире или дефис) или что-нибудь еще? ...

Получить значение символа в юникоде

есть ли способ в Java, чтобы я мог получить эквивалент Unicode любого символа? например, предположим, что метод getUnicode(char c). Звонок getUnicode('÷') должен возвратить \u00f7. ...

Когда мы должны использовать NVARCHAR / NCHAR вместо VARCHAR / CHAR в SQL Server?

есть ли правило, когда мы должны использовать типы Unicode? Я видел, что большинство европейских языков (немецкий, итальянский, английский, ...) отлично в той же базе данных в Столбцах VARCHAR. Я ищу что-то вроде: если у вас есть китайский -- ...

UnicodeEncodeError: кодек 'latin-1' не может кодировать символ

что может быть причиной этой ошибки, когда я пытаюсь вставить чужой персонаж в базу данных? >>UnicodeEncodeError: 'latin-1' codec can't encode character u'\u201c' in position 0: ordinal not in range(256) и как мне его решить? спасибо! ...

MySQL VARCHAR длины и UTF-8

в MySQL, если я создаю новый VARCHAR(32) поле в таблице UTF-8 означает ли это, что я могу хранить 32 байта данных в этом поле или 32 символа (многобайтовые)? ...

Как заменить акцентированные латинские символы в Ruby?

у меня есть ActiveRecord модель Foo, которая имеет ...