banner

Новости

Oct 17, 2023

Как удалить HTML-теги в Google Таблицах

Если вы копируете данные с веб-страниц в Google Таблицы, они могут содержать много нежелательного HTML-кода. Вот как удалить HTML-теги в Google Таблицах.

Google Таблицы — отличный способ систематизировать и анализировать данные. Однако, как и в любом хорошем программном обеспечении, мусор на входе равен мусору на выходе. Если вы получаете данные из других источников, вы можете получить больше, чем рассчитывали; вы можете случайно импортировать нужную информацию, а также кучу бесполезных HTML-тегов. Пока вы не избавитесь от этих тегов, вы не сможете многое сделать со своими данными.

К счастью, не так уж и сложно удалить все эти HTML-теги и оставить только ту информацию, которая вам нужна. Вот как удалить HTML-теги в Google Таблицах.

Теги HTML являются частью кода языка гипертекстовой разметки (HTML), который сообщает веб-браузеру, как отображать содержимое этих тегов. Например, тег HTML может указать вашему браузеру отображать часть текста жирным шрифтом или курсивом, выравнивать текст по центру или создавать рамку, в которую можно встроить контент.

Эти HTML-теги всегда имеют один и тот же формат. Они начинаются с имени тега, заключенного в угловые скобки, например

, и заканчиваются тем же тегом, которому предшествует косая черта, например
. Информация, которую вы хотите извлечь, находится между этими тегами. Например, чтобы выделить текст жирным шрифтом, используйте следующее: Hello World!.

Когда вы копируете данные с веб-страницы, а также значения, которые вы хотите скопировать, вы также можете непреднамеренно скопировать и эти HTML-теги. Они бесполезны для вас в вашей электронной таблице, поэтому вам следует удалить их и оставить только ту информацию, которая вам действительно нужна.

Вы можете создать формулу, которая будет просматривать ячейку, удалять все ее HTML-теги и возвращать все, что осталось. Исходная ячейка останется нетронутой, но из новой ячейки будут удалены все теги HTML, оставив только те данные, которые вам нужны. Вы можете создать эту формулу для одной ячейки, а затем быстро применить ее к нескольким ячейкам.

Чтобы удалить теги HTML с помощью формулы в Google Таблицах:

Эта формула работает с использованиемREGEXREPLACE функция. Эта функция позволяет заменить часть строки другой строкой. Вы предоставляете текст для замены, выбирая ячейку, содержащую теги HTML.

Затем вы предоставляете регулярное выражение, которое будет искать функция. В данном случае регулярное выражение:

Это выражение ищет строку, которая начинается с открытой угловой скобки, содержит хотя бы один символ, не являющийся угловой скобкой, и заканчивается закрытой угловой скобкой. Как мы видели ранее, поскольку все теги HTML начинаются и заканчиваются угловыми скобками, это регулярное выражение найдет все экземпляры этих тегов.

Последняя часть формулы заменяет любые совпадения регулярного выражения вообще ничем. Поскольку все HTML-теги ничем не заменяются, остается только оставшийся текст.

Один из недостатков этого метода заключается в том, что, хотя он и удаляет HTML-теги из ваших данных, он создает новый столбец данных, оставляя при этом исходные данные с тегами. Если вы удалите исходные данные, новые удаленные значения также исчезнут, поскольку формуле не с чем работать.

Вы можете скопировать и вставить данные как значения, но это не идеально. Альтернативой является использование функции «Найти и заменить», чтобы удалить теги HTML из ячеек и оставить результат в той же ячейке.

Чтобы удалить теги HTML с помощью функции «Найти и заменить» в Google Таблицах:

Изучение того, как удалить теги HTML в Google Таблицах, гарантирует, что вам не придется тратить часы на ручное редактирование всех ваших данных, чтобы удалить ненужные теги. Используя любой из вышеперечисленных способов, вы сможете быстро избавиться от тегов и оставить только те данные, которые вам нужны. Возможность использования регулярных выражений здесь является настоящим спасением; определенно стоит узнать больше о RegEx, поскольку он может сэкономить вам огромное количество времени.

ДЕЛИТЬСЯ