Получи случайную криптовалюту за регистрацию!

​​Как удалить emoji из текста? Описание проблемы: Периодичес | R4marketing | канал Алексея Селезнёва | Язык R

​​Как удалить emoji из текста?

Описание проблемы:

Периодически, например при запросе статистики по рекламным кампаниям, или тем более объявлениям, в их названиях вам могу попадаться разные emoji. Вот пример реального названия РК которая попался мне в выгрузке:" _Pis_mo_dlja_uchastnika_KEY_Conference_22.10_ ".

Проблема может возникнуть, например, при попытке записать текст с emoji в базу данных.

Решение:

Удалить emoji из текста можно с помощью регулярного выражения [^\x01-\x7F].

Пример:

Texts = c("Let the stormy clouds chase, everyone from the place ♪ ♬",
"See you soon brother ",
"A boring old-fashioned message" )

gsub("[^\x01-\x7F]", "", Texts)
[1] "Let the stormy clouds chase, everyone from the place "
[2] "See you soon brother "
[3] "A boring old-fashioned message"

Ссылки:
- подсмотрено на stackoverflow в теме "remove emoticons in R using tm package"

#заметки_по_R