hogashi.*

日記から何から

RegExp match indicesためした

 Chrome 90 で入っていた RegExp match indices (https://www.chromestatus.com/feature/6558676666023936) というのを見てへ〜と思ったのでちょろっとおためしした*1

f:id:hogashi:20210507151501p:plain
devtools でおためしした様子

 さっと見た感じでは、マッチしたものそれぞれについて、その登場範囲を配列で返してくれるというものらしい。上の 3つ目の例 ('123aaaabbbb'.match(/(aa)+(?<bee>b)/d))だとこういう感じになっていそう ↓

  • (aa)+(?<bee>b) (全体) にマッチするのは
    • aaaab で (最初を 0文字目として) 3〜7文字目
    • なので [3, 8]
  • (aa) にマッチするのは
    • aa (後半の方) で 5〜6文字目
    • なので [5, 7]
      • 繰り返しだと最後にマッチしたものになってこうなっている?
  • (?<bee>b) にマッチするのは
    • b (最初の1文字) で 7文字目
    • なので [7, 8]

 範囲の感じで終わり側の数字が 1つ多いのは、 GitHub の例を見る限り slice とかでそのまま使えて便利になっています、というように見える。

const re1 = /a+(?<Z>z)?/d;

// indices are relative to start of the input string:
const s1 = "xaaaz";
const m1 = re1.exec(s1);
m1.indices[0][0] === 1;
m1.indices[0][1] === 5;
s1.slice(...m1.indices[0]) === "aaaz";
https://github.com/tc39/proposal-regexp-match-indices#examples

 indices つけるの大変なので /d フラグを明に指定しないとやりません、という仕様らしい。まさにこれがほしいぜというときにつけてあげると小粒に便利そう。 (ところで Chrome Devtools を見ていると /dシンタックスハイライトがまだあたってなさそう……)

As producing this array is expensive, the `.indices` property is only present when the /d flag is passed.

https://www.chromestatus.com/feature/6558676666023936

 GitHub の方には、なんで /d なのかというところに、 d 使っていいのかみたいなことも書かれていた (https://github.com/tc39/proposal-regexp-match-indices#why-use-d-for-the-regexp-flag) 。 indices という単語から取ろうとしたけど、いまある i とかを避けつつ、他の正規表現エンジンも見て d がすでに意味バラバラなので、まあいいかな、みたいな感じになっていそう?

 あとそれに伴って他の正規表現エンジンでの様子をまとめていておもしろい (https://github.com/tc39/proposal-regexp-match-indices/blob/master/flags_comparison.md)。リンクもあるので各エンジンのドキュメントへのリンクまとめみたいになっている……。

www.chromestatus.com

github.com

*1:バージョン: 90.0.4430.93(Official Build) (x86_64)