Chrome 90 で入っていた RegExp match indices (https://www.chromestatus.com/feature/6558676666023936) というのを見てへ〜と思ったのでちょろっとおためしした*1。
さっと見た感じでは、マッチしたものそれぞれについて、その登場範囲を配列で返してくれるというものらしい。上の 3つ目の例 ('123aaaabbbb'.match(/(aa)+(?<bee>b)/d)
)だとこういう感じになっていそう ↓
(aa)+(?<bee>b)
(全体) にマッチするのはaaaab
で (最初を 0文字目として) 3〜7文字目- なので
[3, 8]
(aa)
にマッチするのはaa
(後半の方) で 5〜6文字目- なので
[5, 7]
- 繰り返しだと最後にマッチしたものになってこうなっている?
(?<bee>b)
にマッチするのはb
(最初の1文字) で 7文字目- なので
[7, 8]
範囲の感じで終わり側の数字が 1つ多いのは、 GitHub の例を見る限り slice
とかでそのまま使えて便利になっています、というように見える。
const re1 = /a+(?<Z>z)?/d; // indices are relative to start of the input string: const s1 = "xaaaz"; const m1 = re1.exec(s1); m1.indices[0][0] === 1; m1.indices[0][1] === 5; s1.slice(...m1.indices[0]) === "aaaz";https://github.com/tc39/proposal-regexp-match-indices#examples
indices つけるの大変なので /d
フラグを明に指定しないとやりません、という仕様らしい。まさにこれがほしいぜというときにつけてあげると小粒に便利そう。 (ところで Chrome Devtools を見ていると /d
にシンタックスハイライトがまだあたってなさそう……)
As producing this array is expensive, the `.indices` property is only present when the /d flag is passed.
https://www.chromestatus.com/feature/6558676666023936
GitHub の方には、なんで /d
なのかというところに、 d
使っていいのかみたいなことも書かれていた (https://github.com/tc39/proposal-regexp-match-indices#why-use-d-for-the-regexp-flag) 。 indices という単語から取ろうとしたけど、いまある i
とかを避けつつ、他の正規表現エンジンも見て d
がすでに意味バラバラなので、まあいいかな、みたいな感じになっていそう?
あとそれに伴って他の正規表現エンジンでの様子をまとめていておもしろい (https://github.com/tc39/proposal-regexp-match-indices/blob/master/flags_comparison.md)。リンクもあるので各エンジンのドキュメントへのリンクまとめみたいになっている……。