文字やコードの操作に便利な3つの機能

文字やコードの操作に便利な3つの機能

今日は「文字を扱う便利な機能」を3つ、ご紹介します。

  1. 文字列関数「Substring」
  2. リンク抽出「Text parser」
  3. キーワード検索「Text parser」

文字列関数「Substring」

Substring

文字列関数「Substring(サブストリング)」は、文字列から指定の「位置」にある文字を抜き出します。

例えば、140文字のツイートから最初の50文字を抜き出す、といった場面で使います。画像の例は「これはどうみても日本語です。」という文字列から「日本語」を抜き出しています。

この関数を使うと、連携先のアプリやWebのフォームから送られてきた文字の「最初の3文字」だけを抽出することも可能になります。

その場合、以下のように設定します。

substring({{任意の文字列}}; 0; 3)

0は文字の最初の「位置」を指します。そして3は切り取る最後の「位置」を指定しています。結果、3文字抽出されます。これは、英語でも日本語でも同じです。

動画でも解説しています。こちらからご覧いただけます。

リンク抽出「Text parser」

Text parser for image tags

テキスト操作系モジュール「Text parser(テキスト・パーサー)」は、HTMLソースコードから任意のタグを抜き出したり、キーワード検索するための機能です。

後述しますが、キーワード検索は正規表現を使います。リンク、画像、IframeといったHTMLのコードを抽出したい場合は、画像のような指定を行います。

これによって、入力されたHTMLソースコードから画像タグだけを抽出することができます。もっというと、画像タグの中の属性を個別に拾い出してくれます。

わざわざスクレイピング・サービスを使うまでもない、というときに活躍します。

キーワード検索「Text parser」

Text parser for regular expression

同じく、テキスト操作系モジュール「Text parser」では、正規表現をつかったキーワード検索も可能です。

例えば、HTMLソースコードから「パラグラフ(pタグ)」だけを抜き出したいときは、この正規表現を使います。

<p>(.*?)<\/p>

正規表現はかなり難しいのですが、上記のようなパターンを入れておくと、パラグラフだけ抜き出してくれます(タグは半角にしてください)。

抽出結果は、以下の画像のようになります。

Regular Expressions

まとめ

今回の記事では、3つのテキスト操作機能、文字抽出関数「Substring」、タグ抜き出しモジュール「Text parser」、そしてキーワード検索モジュール「Text parser」をご紹介しました。

Integromatには、他にも文字操作系の便利機能があります。例えば、任意の文字列が含まれているかどうかをブーリアン判定(True/False)する関数や、文字の置き換え関数、文字の長さを数える関数などがあります。

そういった関数やモジュールを少しずつIntegromat日本コミュニティYouTubeチャネル「アプリ起業・自動化」でご紹介していく予定です。

気になる方は、コミュニティに参加いただいたり、チャネル登録をお願いいたします!

機能解説リクエストは、こちらのフォームから送っていただくこともできます。

ノーコードで自動化を!

Integromat日本コミュニティへの参加はこちらから