◎正当な理由による書き込みの削除について:      生島英之とみられる方へ:

Regular Expression(正規表現) Part17


動画、画像抽出 || この掲示板へ 類似スレ 掲示板一覧 人気スレ 動画人気順

このスレへの固定リンク: http://5chb.net/r/tech/1702684760/
ヒント:5chスレのurlに http://xxxx.5chb.net/xxxx のようにbを入れるだけでここでスレ保存、閲覧できます。

1デフォルトの名無しさん
2023/12/16(土) 08:59:20.50ID:uVHZ7e2j
Regular Expressionスレです。

質問する場合は必ず実装言語や処理系ソフトウェア名を示してください。

前スレ
Regular Expression(正規表現) Part16
http://2chb.net/r/tech/1635936601/

次スレは>>980宜しく
テンプレ>>2以降
2デフォルトの名無しさん
2023/12/16(土) 08:59:57.66ID:uVHZ7e2j
スルーされにくい質問のテンプレと例

●Regular Expressionの使用環境
Java1.5

●検索か置換か?
検索

●説明
各行の1番目のAまでを検索したい

●対象データ
ABCA
BCAA
CABA

●希望する結果
ABCA
^
BCAA
^^^
CABA
^^

※ ^ はアンダーラインだそうな ^^;
3デフォルトの名無しさん
2023/12/16(土) 09:00:18.14ID:uVHZ7e2j
◆関連サイト
正規表現メモ
http://www.kt.rim.or.jp/~kbk/regex/regex.html
Perl正規表現雑技
http://www.din.or.jp/~ohzaki/regex.htm

詳説 正規表現
http://www.oreilly.co.jp/books/9784873113593/
正規表現クックブック
http://www.oreilly.co.jp/books/9784873114507/

正規表現プログラミングFAQ
http://capslockabcjp.kitunebi.com/faq.html
.NET Framework の正規表現 | Microsoft Docs
https://docs.microsoft.com/ja-jp/dotnet/standard/base-types/regular-expressions
正規表現 - JavaScript | MDN
https://developer.mozilla.org/ja/docs/Web/JavaScript/Guide/Regular_Expressions
鬼車
https://github.com/kkos/oniguruma
鬼雲
https://github.com/k-takata/Onigmo
bregonig.dll(鬼雲の正規表現をサクラエディタ等で使用するためのライブラリ)
http://k-takata.o.oo7.jp/mysoft/bregonig.html
Boost.Regex 1.45.0 (日本語訳)
http://alpha.sourceforge.jp/devel/boost.regex_ja_1_45_0.pdf

秀丸: 複数行にまたがる検索について
http://homepage2.nifty.com/jr-kun/hidemaru_qa/4_regulr.html#RETURNS

サクラエディタ: 改行
http://d.hatena.ne.jp/myokoym/20101219/1292779058
※ サクラエディタでは複数行に渡る検索・置換は出来ません。
4デフォルトの名無しさん
2023/12/16(土) 09:00:38.18ID:uVHZ7e2j
正規表現技術入門
https://gihyo.jp/book/2015/978-4-7741-7270-5

↑の著者の一人であり Onigmo(鬼雲)やbregonig.dll の作者でもあるtakata先生のツイとQiitaの記事
https://twitter.com/k_takata

鬼雲に非包含オペレータを実装した話
https://qiita.com/k-takata/items/4e45121081c83d3d5bfd
https://twitter.com/thejimwatkins
5デフォルトの名無しさん
2023/12/16(土) 17:18:36.20ID:ZkpISsx+
>>1 乙 前スレ消化するのに2年かかってるから次スレは2025年末か
6デフォルトの名無しさん
2023/12/16(土) 19:02:49.70ID:UfR4i5aB
MSの.NETとMDNのJSの説明はよいけど
Perlはperlreを載せるべきじゃ
7デフォルトの名無しさん
2023/12/16(土) 21:11:50.18ID:ZkpISsx+
正規表現スレのテンプレにperl公式が無かったのかw

詳説 正規表現ももうだいぶ古い
近頃の正規表現エンジンが進化しすぎてもう本に全部まとめられないよね
perlの正規表現の解説だけで1冊分になってしまいそう

>スルーされにくい質問のテンプレと例

いつもスルーしてる
8デフォルトの名無しさん
2023/12/17(日) 02:07:16.68ID:OHxpVvei
>非包含オペレータ
これ包茎オペに空目するからやめたほうがいいとおもう
9デフォルトの名無しさん
2023/12/17(日) 07:18:27.92ID:FEe4n35c
俺すげぇ面白い事思い付いたわ
天才じゃね?
って深夜に思い付いちゃったんだろうな
異世界転生モノ好きそう
10デフォルトの名無しさん
2023/12/17(日) 10:40:09.52ID:KG6/TFz3
俺も思ったけど書き込まなかった
「包茎」「空目」「深夜」どこにもかかってないんだが
>9 は異世界転生モノに親でも殺されたのか流行り物が嫌いなだけなのか
11デフォルトの名無しさん
2023/12/17(日) 11:33:01.98ID:lxaANove
池沼お気に入りの言い回し:親でも殺された
12デフォルトの名無しさん
2023/12/17(日) 11:52:23.27ID:uskvVvSC
どっちの方が気持ちわるいかと言えば
俺は>>9に一票

もちろん>>9 vs >>10
13デフォルトの名無しさん
2023/12/17(日) 12:06:59.79ID:3hsIyhlE
まあ>>9は場違いだな
14デフォルトの名無しさん
2023/12/17(日) 13:08:14.11ID:hPnGIyzU
美少女だから無罪で
15デフォルトの名無しさん
2023/12/17(日) 16:47:12.08ID:C55sNZf7
以下のあぼーん用正規表現を教えて下さい

文字列3文字
文字列5文字
(空白改行)
文字列3文字

よろしくお願い致します
16デフォルトの名無しさん
2023/12/17(日) 22:44:10.33ID:WFgQcr7d
文字列3文字が固有の3文字なのか任意の3文字なのかがわからん
空白と空は意味がちがうから空白改行もどうとらえていいかわからん
そういう厳格さがないと正規表現は使い切れない
17デフォルトの名無しさん
2023/12/17(日) 23:44:06.80ID:6Rk7Y10s
^ \S{3} <br> \S{5} <br> +<br> \S{3} $
18デフォルトの名無しさん
2023/12/18(月) 00:25:33.88ID:gHmacq4F
>>16-17
某板に荒らしが発生しているので
荒らしレスの冒頭の
─────────────────────
>>1
岡村ほまれ

可愛い
─────────────────────をあぼーんワードにしたいのです
よろしくお願い致します
19デフォルトの名無しさん
2023/12/18(月) 00:54:45.24ID:zFl9jE+m
情報を小出し後出しにするやつってうざいよな
もう遅いけど使用環境を最初に示すべきだった
20デフォルトの名無しさん
2023/12/18(月) 10:40:38.35ID:pykETp8J
改行の扱いは専ブラによって違うということを知っておこう
<br>だったり\sだったりする
21デフォルトの名無しさん
2023/12/18(月) 11:17:13.95ID:6u0hXPC3
(?><[bB][rR]>|\r\n|[\r\n])
22デフォルトの名無しさん
2023/12/19(火) 17:06:05.93ID:97fwYV9l
モ娘(狼)板に涌いている荒らし

http://2chb.net/r/morningcoffee/1702957612/4-7
23デフォルトの名無しさん
2023/12/20(水) 09:54:40.16ID:HDpQovyo
UPLIFT プレミアム・サービスのお知らせ

https://uplift.5ch.net/

UPLIFT 主な特典
・連続投稿の規制を緩和します。
・スレッド作成時の規制を緩和します。
・5ch.netのスレッド表示画面に表示される広告を除去します。
・5ch.net専用ブラウザで5ch.netの過去ログを閲覧できるようになります。
・海外からのアクセス・ホスト経由からでも書き込みができるようになります。
・書き込みが規制されているプロバイダーからでも書き込みができるようになります。
・5ch.netを安定して利用できるように運営を支援できます。

5ちゃんねるを存続させるためには、皆様のご協力が必要です。

最後まで御精読いただきありがとうございました。
24デフォルトの名無しさん
2023/12/20(水) 13:16:05.38ID:kMNBqppc
他は無料で良いサービス提供出来てるのに金払えは甘え
5ch運営が殿様商売で無策だったツケが回って来てるだけの自業自得だから、5chなんか潰れちまえ
取り敢えずNG突っ込んだわ
25デフォルトの名無しさん
2023/12/20(水) 19:23:53.60ID:owPAm/QX
このスレも役目を終えつつあるね、今時の子はこんなところには来ないと思う
yahoo掲示板にでも行ってるのかな
26デフォルトの名無しさん
2023/12/20(水) 21:03:08.80ID:lnEIVk9M
ChatGPTとかのAIでしょ
Yahoo掲示板こそジジイしか居ないイメージだわ
27デフォルトの名無しさん
2023/12/20(水) 23:05:30.95ID:owPAm/QX
そか、AIに作ってもらえるならクレクレする必要もないね、いいことだ
28デフォルトの名無しさん
2023/12/20(水) 23:36:14.45ID:z/5Qp7sj
そして「ChatGPTでXXをやってみたいんですがうまくいきません、どうしたら」というクレクレ質問が大量発生
29デフォルトの名無しさん
2023/12/20(水) 23:46:12.22ID:owPAm/QX
私もそのクレクレになりそうw
30デフォルトの名無しさん
2023/12/22(金) 12:31:09.65ID:ivJ9ZoTT
あるプログラムのコーディングはすごく処理速度を意識してるのに
そのプログラムに使ってる正規表現はまったく効率を考えてない,というケースをよく見かける
正規表現をAIが作るようになれば改善されるかもね
31デフォルトの名無しさん
2023/12/22(金) 18:21:26.60ID:55x+HPTI
人「おいAI、お前が作った正規表現とてつもなく遅いじゃないか」
AI「はい、ヒトが解読しやすい方が良いと判断しました。速度の問題は時が経てばマシンの性能向上で解決しますが、ヒトの解読力の方は...」
32デフォルトの名無しさん
2023/12/23(土) 21:28:49.10ID:jMjD4WOY
> 速度の問題は時が経てばマシンの性能向上で解決しますが

海原雄山「このポンコツAIを作ったのは誰だー」
33デフォルトの名無しさん
2023/12/29(金) 19:40:02.08ID:c5lsn96k
話が高度過ぎて付いていけない
34デフォルトの名無しさん
2024/01/15(月) 07:25:04.51ID:LwnsIRDe
速い正規表現ってどういうこと?
35デフォルトの名無しさん
2024/01/15(月) 09:06:53.25ID:ZT1xOGvJ
ステップ数が小さい
36デフォルトの名無しさん
2024/01/15(月) 15:35:12.01ID:VYSGEVd4
正規表現とてつもなく遅い でグーグル検索しようぜ
37デフォルトの名無しさん
2024/01/15(月) 16:06:35.46ID:UMjmkZMs
俺にかかれば正規表現はいくらでも遅くなる
任せてくれ
38デフォルトの名無しさん
2024/01/31(水) 22:37:07.48ID:jTCZHTVk
.Netが正規表現エンジンを改良したと話には聞いてたけど
6年でこんなに変わるもんなんだな

      Language Email(ms) URI(ms) IP(ms) Total(ms)
2018年 C# .Net Core 1952.13  1681.00 111.32 3744.45
2024年 C# .Net Core   6.46    3.79  19.35  29.59
https://github.com/golang/go/issues/26623
39デフォルトの名無しさん
2024/01/31(水) 23:41:08.70ID:O0N6A3M6
>>38
.Net Core(現 .Net)ってそんな前からあったっけ?
40デフォルトの名無しさん
2024/02/01(木) 23:01:03.30ID:YPnx34uD
.NET Core 1.0は2016だからね
41デフォルトの名無しさん
2024/02/04(日) 19:04:14.97ID:1hv2Rh8g
案外歴史が長い!
42デフォルトの名無しさん
2024/02/04(日) 21:10:13.35ID:GiV0zbjO
旧エンジンにマシンパワーをどれだけ積んでもネットブックで動かす新エンジンに勝てなそう
43デフォルトの名無しさん
2024/02/04(日) 22:35:02.60ID:FtEwRyHG
それ同じ環境と条件で比較テストしてるわけじゃないから単純にエンジンの違いによる性能差じゃないからね
44デフォルトの名無しさん
2024/02/04(日) 23:23:40.51ID:l8NY0XdM
正規表現は昔からあるのに未だに進化するスピードが尋常じゃないのはすごいことだ
AIの登場でこれからどうなるのか想像付かない
45デフォルトの名無しさん
2024/02/05(月) 03:06:40.22ID:UJ2m14qd
正規表現はオートマトンに変換するだけだから
AIとは何の関係もないぞ

高速化もこれ以上は理論的にできないし
書き方で速さが違うのは当たり前
46sage
2024/02/05(月) 15:59:30.46ID:6V7y69ze
現代の正規表現エンジンは純粋なオートマトンだけで動いているわけではないよ
47デフォルトの名無しさん
2024/02/14(水) 22:19:25.22ID:2oHCpHj3
例えをあげると以下の正規表現を使った検索では

[^a]+c[^b]+

まず"c"を検索して見つからなければマッチ失敗を返す
このときオートマトンは使用されないまま検索が終わる

これは実在する正規表現エンジンの動作ではなくあくまでイメージ
AIならもっと柔軟にこういう処理が出来るかも
48デフォルトの名無しさん
2024/03/18(月) 04:18:56.57ID:LIfqFVfX
そういう高速化はワイルドカードで
数パターンに分類してやったことはあるな

というわけで前段階で複数のワイルドカードをand/orでつなげた表記も受け付けるようにすれば
シンプルな分結構高速化できる
49デフォルトの名無しさん
2024/03/23(土) 22:54:40.43ID:tYxC9w64
ふむ。
50デフォルトの名無しさん
2024/03/24(日) 19:41:23.90ID:aAFJLVlH
正規表現って現実の何かで例えるなら何?
パズル?
言語学的な感じも数学的な感じもしないような
51デフォルトの名無しさん
2024/03/24(日) 23:03:04.96ID:IO+c4sKO
けんけんぱ
52デフォルトの名無しさん
2024/03/25(月) 00:12:28.47ID:BW1at+9B
ずいずいずっころばし
53デフォルトの名無しさん
2024/03/25(月) 17:12:10.55ID:vkyh3m8T
ますたーまいんど
54デフォルトの名無しさん
2024/03/28(木) 12:08:33.08ID:Y8B9QCf2
正規表現が $ と ^ をラインアンカーとして採用した理由 ソフトアンテナ
https://softantenna.com/blog/regex-line-anchors/
55デフォルトの名無しさん
2024/03/28(木) 23:34:35.78ID:WoHbaWvj
正規表現を初めて使ったのがken氏でOnigmoもken氏
そして現代で正規表現と言えばPerl

この3つの要素を合わせるとなんと>>51になる
56デフォルトの名無しさん
2024/03/30(土) 12:49:02.61ID:oQnMbHXx
すべった
57デフォルトの名無しさん
2024/03/31(日) 20:21:11.66ID:R8UIIGRi
認められてえらい
58デフォルトの名無しさん
2024/04/01(月) 17:41:25.33ID:Jdw9gPZP
つまりムトゥ神か
59デフォルトの名無しさん
2024/04/04(木) 02:49:29.95ID:Bu2po2+x
AAA _ BBB _ CCC _ DDD

BBB AAA
にする
60デフォルトの名無しさん
2024/04/04(木) 03:53:18.24ID:X4Q29337
使用環境メモ帳
☑正規表現を使うにチェック
検索するにAAA _ BBB _ CCC _DDD
置換にBBB AAA
61デフォルトの名無しさん
2024/04/04(木) 22:23:37.89ID:sf62q9R2
[A][A][A] _B{3,3} _ (C)(\1)\2 _[\x{44}][\x{44}][\x{44}]
62デフォルトの名無しさん
2024/04/23(火) 23:42:47.37ID:f/wKo/xU
チェックマークの絵文字かっこいい
63デフォルトの名無しさん
2024/04/28(日) 08:09:34.58ID:bvIrnysh
カ)ミツカン カカ)ミツカン
の単語の始まりにある「カ)」を取ってきたいのだが、
[カ\カユユ][)\)]
だと両方ヒットする。
\b[カ\カユユ][)\)]
だと両方ヒットしない。
\bて単語の始まりじゃないの?
64デフォルトの名無しさん
2024/04/28(日) 08:33:21.76ID:cFVqBor9
使ってるプログラミング言語は?
65デフォルトの名無しさん
2024/04/28(日) 08:43:14.02ID:rlAkFFFr
>>63
一般に正規表現の \b 及び \B の文脈における「単語」とは「\w+」のこと
「か」は単語ではないので、当然ながらその直前の位置(境界)に \b はマッチしない
66デフォルトの名無しさん
2024/04/28(日) 08:44:57.81ID:w8Q1u9O5
単語の境界の単語とは\wかどうか
先頭が\w、\wと\W(又は\Wと\w)の間、最後が\w
空白も括弧も全角文字も\wではなく、全てが\Wの連続なので境界がない

(?<=^|\s| )[カ\カユユ][)\)]
こんな感じかなあ?
67デフォルトの名無しさん
2024/04/28(日) 09:15:58.39ID:w8Q1u9O5
句読点(、。,.,.)があるならそれもか
68デフォルトの名無しさん
2024/04/28(日) 09:24:53.38ID:b3SQbRRV
https://regex101.com/r/HbkFb9/1
69デフォルトの名無しさん
2024/04/28(日) 10:39:11.02ID:bvIrnysh
>>66
サンクス。
正規表現チェッカーだとうまく行くが、VBAだとエラーする。
カカ)ミツカンていう会社名なんてないから諦めるわ。
70デフォルトの名無しさん
2024/05/01(水) 06:39:29.77ID:QLRpEQs1
=?UTF-8?Q?=F0=9F=91=BBIt's_Halloween_Sale_=E2=80=93_Time_To_Save!?=
=?UTF-8?Q?=F0=9F=91=BBIt's_Halloween_Sale_=E2=80=93_Time_To_Save!?=

quoted-printableを切り出すのは難しいな
71デフォルトの名無しさん
2024/05/01(水) 10:32:16.36ID:G90j3Kau
切り出しするのはMIMEパートで
中身はすべてQPだから難しくなさそうだけど罠がある?
72デフォルトの名無しさん
2024/05/25(土) 14:18:39.96ID:5mKzxThb
こんちゃ
flexible renamerで上のフォルダを検索して、そのフォルダ名をファイル名にしたいのですが、上のフォルダの検索方法はどうすればいいんでしょうか。

../
これでいけるとおもったんですが、文字列になるみたいです
73デフォルトの名無しさん
2024/05/25(土) 14:34:39.35ID:GTAuICNX
置換えを\fにするんでは
親フォルダなら\Fか
74デフォルトの名無しさん
2024/05/25(土) 14:37:23.14ID:NyW0Hsfe
置換については \F が親フォルダ名を示すメタ文字
「サポート▶」クリックで表示されるリストを確認するといい
75デフォルトの名無しさん
2024/05/25(土) 15:09:38.89ID:5mKzxThb
ありがとう(*´ω`*)解決ナリよ
76デフォルトの名無しさん
2024/05/25(土) 16:34:20.14ID:5mKzxThb
ところでwindowsで10の別名フォルダを同名にリネームして、中身を1つに統合みたいなことは出来ないのでしょうか?
77デフォルトの名無しさん
2024/05/25(土) 17:54:07.45ID:+J5I1fk8
スレチ
78デフォルトの名無しさん
2024/05/25(土) 18:00:34.05ID:o9ml7dor
>>76
バッチでも書きゃいいだろ
79デフォルトの名無しさん
2024/05/25(土) 18:15:50.33ID:5mKzxThb
はい
80デフォルトの名無しさん
2024/05/25(土) 20:23:33.14ID:Roch7C/E
windows ntfs union
で調べたらわかるけど困難
Linux上で実現させてそこへアクセスが単純かな
81デフォルトの名無しさん
2024/05/27(月) 00:15:11.27ID:3w+qnBSP
一旦同名フォルダ作って全部ぶっ込んで統合先の親に移動するだけだろ
誰もunionfsごっこやりたいとか言ってないぞ
82デフォルトの名無しさん
2024/05/29(水) 18:58:45.90ID:uKjwQH9U
生気表現 ('A`)
性器表現 ((i))  くコ:彡
どれがいい?
83デフォルトの名無しさん
2024/05/30(木) 19:54:12.15ID:BiQuU9Dh
何がregularなのかいまだにわからん
84デフォルトの名無しさん
2024/05/31(金) 02:22:57.15ID:8gCpYzBa
たまには英語の辞書を開いてあげろ
85デフォルトの名無しさん
2024/05/31(金) 21:42:18.07ID:TouRjKKE
レギュラーコーヒーのレギュラーって何って質問しても満足な回答得られないから今度やってみ
86デフォルトの名無しさん
2024/06/01(土) 15:29:35.29ID:AnvSsNLo
非正規コーヒー
87デフォルトの名無しさん
2024/06/01(土) 17:45:51.25ID:zLTUouUC
レギュラーコーヒーのレギュラーはnormalとかordinaryの意味でのレギュラー
インスタントコーヒーと区別するために作られた日本語

regular expressionのregularは「規定されたルールに従った」という意味でのレギュラー
形式言語理論からの用語
88デフォルトの名無しさん
2024/06/01(土) 18:52:55.00ID:4ZWo8ROd
>>87
>>インスタントコーヒーと区別するために作られた日本語

いわゆる「レトロニム」ってやつだね
89デフォルトの名無しさん
2024/06/02(日) 06:26:43.62ID:j0fRNfQ2
正規表現のregularはレギュレーション的な意味?

そしてコーヒーそうだったのか
普通の王道の味のコーヒーって意味だと思ってたwww
90デフォルトの名無しさん
2024/06/03(月) 02:03:28.38ID:YPamPwdM
英和だけじゃなく英英も調べるようにしたほうがいいよ
91デフォルトの名無しさん
2024/06/03(月) 19:56:37.73ID:PWp7k61t
>>87
形式言語理論だと正則表現と訳すことの方が多いらしい
92デフォルトの名無しさん
2024/06/05(水) 15:42:09.20ID:kJJy3o9y
セーソク表現か…
93デフォルトの名無しさん
2024/06/06(木) 14:37:37.38ID:E3zmVJgl
>>89
コーヒーソーダは違います
94デフォルトの名無しさん
2024/06/18(火) 14:11:57.80ID:pzzAto97
質問させてください

# h1
## h2
こういった構造なのですが、h2のタブ(上の例では半角スペースにしてます)を除いた箇所だけマッチさせたいです
# .*
## .*
1つ目をh1用、2つ目をh2用としてマッチさせたいのですが、これだと1つ目がh2の後半部分にもマッチしてしまいます。
対策はあるでしょうか
95デフォルトの名無しさん
2024/06/18(火) 14:59:50.56ID:J2T1cvE/
2つ目を1つ目にして
1つ目を2つ目にする
96デフォルトの名無しさん
2024/06/18(火) 15:10:51.31ID:pzzAto97
すみません
どういうことでしょうか。
97デフォルトの名無しさん
2024/06/18(火) 15:21:22.31ID:TPDReXqh
後読みが使える環境なら
(?!#)# .*
98デフォルトの名無しさん
2024/06/18(火) 15:22:52.25ID:TPDReXqh
^# .*で問題ないのか
99デフォルトの名無しさん
2024/06/18(火) 17:57:12.95ID:pzzAto97
試したところ、後読みというは使えない環境のようでした
meryというテキストエディタです
100デフォルトの名無しさん
2024/06/18(火) 17:58:50.33ID:pzzAto97
そっちのスレで聞いてみますね
101デフォルトの名無しさん
2024/06/18(火) 20:25:18.67ID:kkbo/g2D
FindOnig
102デフォルトの名無しさん
2024/07/09(火) 03:18:21.56ID:pEcdZJzG
re2のレポジトリに、ずっとコード書いてきた人を追悼するissueが立ってるけど
いたずらじゃなく本当だとしたら今後どうするんだろ
正規表現エンジンの設計ってわりと専門性高めで後任を見つけるのも簡単ではなさそうだけど
103デフォルトの名無しさん
2024/07/10(水) 22:30:27.80ID:gmanX3ar
You! Google 入っちゃいなよ!
104デフォルトの名無しさん
2024/07/14(日) 06:46:47.39ID:wEMWtxb4
これ以上仕様ごちゃごちゃ追加しても
使いこなせる人1%もいないから放置でいいよ
105デフォルトの名無しさん
2024/07/15(月) 14:02:14.21ID:glISuHIA
お前がこなすんだよ!
106デフォルトの名無しさん
2024/07/16(火) 09:13:43.60ID:dYW+o1n8
お前がこなたなんだよ!
107デフォルトの名無しさん
2024/07/17(水) 20:43:28.55ID:F5hkyutw
Googleのre2とIntelのhyperscanは他の色んな正規表現エンジンを過去のものにした
108デフォルトの名無しさん
2024/07/20(土) 05:52:51.61ID:/niJ3Ici
高速な正規表現エンジンを求める人が遅い正規表現を作って使ってたりする
正規表現エンジン作者はユーザーのアップデートもしたいだろうな
109デフォルトの名無しさん
2024/07/22(月) 03:43:13.27ID:qSKgOXFg
そういうのはエディタの仕事だ
ビジュアライザー付き正規表現ダイアログボックスで
ミスなく正規表現を入力したらAIが改善を指摘すればよし
110デフォルトの名無しさん
2024/07/22(月) 15:45:56.06ID:L5BeUc31
正規表現を作るのが下手な人は書き始める前のアルゴリズム作成の段階で
おかしくなってる場合も多い それ含め全部AIがやってくれるのが理想だ
111デフォルトの名無しさん
2024/07/22(月) 15:48:23.43ID:65P6Lbbe
場合抜けしてる勘違いぎみの式だけを見たって
本来の意図が何だったのかAIじゃなくて人間でもわからん場合もあるよね
112デフォルトの名無しさん
2024/07/22(月) 17:18:51.25ID:JYnS/4wE
正規表現だけみせても最適化しかできないだろうから
周辺のコードも与えて関数レベルで出力してもらうのが適当かもね
113デフォルトの名無しさん
2024/07/23(火) 19:28:10.50ID:Dt1Z//LV
AIに抽出してもらえば正規表現いらないじゃん
114デフォルトの名無しさん
2024/07/29(月) 23:15:46.44ID:rj9tTr/V
●Regular Expressionの使用環境
JaneXeno

●検索か置換か?
検索

●説明
.com .net .jp 以外のドメインを含むURLをNGにしたい

●対象データ
http://example.com
http://example.net
http://example.jp
http://example.cn
http://example.xyz
https://example.com
https://example.net
https://example.jp
https://example.cn
https://example.xyz

●希望する結果
http://example.cn
http://example.xyz
https://example.cn
https://example.xyz
115デフォルトの名無しさん
2024/07/30(火) 15:30:31.34ID:QttCMg3R
>>114
https?+://(?:[!-~&&[^./"()<>]]++\.)++(?!com|net|jp)(?>[a-z]{2,10})(?::(?>[0-9]{2,5}))?+(?>[/?#]|(?![!-~&&[^"()<>]]))
116114
2024/07/30(火) 16:01:05.48ID:DGOcYJSo
>>115
神様、マジありがとうございました
117デフォルトの名無しさん
2024/08/04(日) 11:21:08.46ID:H8uHYzPU
(?>[/?#]|(?![!-~&&[^"()<>]]))

これは先読み否定1つにまとめられる

(?!com|net|jp)

これはcomeやjpgも弾いてしまう

どちらも実用上は問題ない
前者は頭の体操にはちょうどいい難易度
118114
2024/08/04(日) 11:54:05.49ID:katRHk63
>>117
ちょっと何言ってるか分からない
119デフォルトの名無しさん
2024/08/04(日) 12:37:10.85ID:5uZlH5sT
アーガスで一番右に行ってから着陸しろって意味じゃね?
120デフォルトの名無しさん
2024/08/20(火) 21:50:27.06ID:KT2/xy/p
●Regular Expressionの使用環境
JaneXeno

●検索か置換か?
検索

●説明
ageとsageと空欄以外の文字列が含まれる場合を検出したいです

よろしくおねがいします
121デフォルトの名無しさん
2024/08/21(水) 06:42:43.17ID:7ZTrDQRo
メール欄を検索対象にしたレス抽出ってこと?
\A(?!s?age$)
122デフォルトの名無しさん
2024/08/21(水) 08:39:25.39ID:mGvismew
>>121
ありがとうございます
メール欄がageとsageと空欄を除き、それ以外をNGにしたいです
123120
2024/08/22(木) 07:25:48.82ID:mXgFFjHI
>>121
その正規表現だと全てNGになってしまいました・・・
124デフォルトの名無しさん
2024/08/22(木) 07:36:11.31ID:Lj1UZYEn
>>123
ぜんぜんユーザじゃないけどbregonig.dll導入で解決しそう
125デフォルトの名無しさん
2024/08/22(木) 09:04:27.38ID:NijHRpmx
^(?!age$|sage$|$).+
126デフォルトの名無しさん
2024/08/22(木) 09:05:35.42ID:knLF+ZG1
>>123
(^s?age$|^$)は?
サンプルがないからよくわからんけど構造によっては空欄がムズイ気がする
127デフォルトの名無しさん
2024/08/22(木) 09:53:46.14ID:od4YjwYP
明らかにソフトのスレで聞いた方が早いだろう
JaneXeno質問スレ9
http://2chb.net/r/software/1722559511/
128デフォルトの名無しさん
2024/08/22(木) 10:35:07.43ID:B9IGKhdB
^(?!sage|*age|\s|\S).*$  前方一致否定
^(?!.*sage|*age|\s|\S).*$  部分一致否定
^(?!.*sage$|*age|\s|\S) 後方一致否定


動くかはしらん
129デフォルトの名無しさん
2024/08/22(木) 10:45:02.10ID:1r7uDbgD
^(?!age).*$
^(?!sage).*$
^(?!\s).*$

を3行前方一致の否定で分けてかいてみたら?全角空白はわからん
130デフォルトの名無しさん
2024/08/22(木) 11:53:01.69ID:Z0c4Ov9t
NG Addr 正規(含まない)
^(age|sage|)$
131デフォルトの名無しさん
2024/08/22(木) 12:27:50.31ID:1pp2sZBh
>>124 をせんとエンジンがよわよわなだけで
正規表現は >>121 であってるし低脳ばっかやな
132デフォルトの名無しさん
2024/08/22(木) 16:58:52.48ID:WSGH1Pr6
datで下の3つ以外でmatchするってことだろ(書き込みエラーで<>に置き換えてる)
名前(変動)<>sage<>2024/08/22(ry
名前(変動)<>age<>2024/08/22(ry
名前(変動)<><>2024/08/22(ry
専ブラによってエンジンが違うから環境いれる気にはならんが
133デフォルトの名無しさん
2024/08/27(火) 22:04:04.81ID:K31idf52
age sage の前後に半角空白が1つまたは2つ入ることを想定すべき
Janeの全盛期ならこんなのすぐに解決してたな
134デフォルトの名無しさん
2024/08/28(水) 09:58:05.19ID:M0ceOk+r
想定すべき、って言えるのなんなんだろう?
そこまで想定してなくても実用上十分、てことは多々あるだろう
135デフォルトの名無しさん
2024/08/28(水) 11:44:10.78ID:29oRaxIo
スレのdatは板ごとに微妙な違いがある
半角空白が前後に入るスレは珍しくなかった
今の人が知らないのは仕方ない
136デフォルトの名無しさん
2024/08/28(水) 12:04:38.47ID:TruuGgPL
>>135
それこそ想定しないても通常大丈夫なものじゃん
俺のLog漁っても20年以上前からあるけど、まだ日付けの年号が2桁でIDも付いてないものでも
前後に空白は付いてなかったくらいだ
俺はレス本体と一時期のスレタイトルぐらいしか記憶にないよ
137デフォルトの名無しさん
2024/08/28(水) 12:06:40.94ID:TruuGgPL
スレタイトルは空白じゃなくてタブだったので訂正しとく
138デフォルトの名無しさん
2024/08/28(水) 15:51:55.48ID:29oRaxIo
半角空白が入る板が存在しないなら対応する必要は無いよ

ただ、自分なら対応したものを作る
そういう板が1つでもあったら作り直しになるから

質問者さんが使っている板が半角空白が入る板ではないという確証が無い以上
対応しておくのが無難でしょう、したらばやJane板のような外部板のことまで考えるとね
139デフォルトの名無しさん
2024/08/28(水) 15:59:03.58ID:TruuGgPL
実用上十分ってことを知らんのか
さらに、他BBSでも空白が入るところは大手ではないよ
(したらば、おーぷん、JANE総合も入らない)
140デフォルトの名無しさん
2024/08/28(水) 19:41:57.47ID:29oRaxIo
大手じゃないところで半角空白が入る板があったら誤作動する正規表現を作るよりも
対応したものを作るほうがベターだと思うが

頑なに非対応にする理由もあるまい
141デフォルトの名無しさん
2024/08/29(木) 00:19:30.02ID:3od28NMQ
メール欄がわざと「 age 」の奴をNGできない
142デフォルトの名無しさん
2024/08/29(木) 19:22:18.21ID:s7DstX6Q
>>133 は対応するべき、て言い切ってる
自分ならこうするとか、この方がベターとかとは一線を画す表現
やらなきゃいけないと言っている

でもさ、不特定多数に配るアプリの話じゃないんだよ?
143デフォルトの名無しさん
2024/08/29(木) 19:26:50.79ID:s7DstX6Q
RFC準拠のメールアドレスの正規表現はクソ長いが個人で使うのにそこまで要らん
の話思い出した
144デフォルトの名無しさん
2024/08/29(木) 19:38:28.39ID:zKbcOD8k
自分が使うものなら好きにすれば良いが質問の回答として正規表現を作るなら
柔軟性を確保するにこしたことはない
でないと質問者は自分じゃ直せないからちょっとした誤作動でまた質問しに来てしまう
そういう意味で「すべき」と書いたよ、何か問題ある?

> メール欄がわざと「 age 」の奴をNGできない

わざとでない「 sage」がNGになってしまうのはいいの?
145デフォルトの名無しさん
2024/08/29(木) 21:34:59.96ID:s4c4C/Bz
試しに、名前とメール欄に前後半角空白付きで書き込んでみた
結果、datからは前後の半角空白は削除されて付いてない

そもそも、可能性があるってだけで対応しないといけないってのはおかしいだろ
たった一つだけでいいのでそういう例がある(あった)というものを出すべき
146デフォルトの名無しさん
2024/08/29(木) 21:37:57.27ID:s4c4C/Bz
書いたところは
http://2chb.net/r/software/1724332370/204-206
それぞれJaneStyleで末尾整形あり、整形なし、汎用ブラウザ(firefox)で書いた
147デフォルトの名無しさん
2024/08/29(木) 23:45:06.51ID:zKbcOD8k
それは掲示板だって半角空白に対応させてるってことでしょ
正規表現で半角空白に対応しておくべきと書くことはそんなにおかしなことなの

質問者はまだ未解決のようだけどその原因が半角空白でないと言い切れる?
最初から対応しておけばこの可能性を考えずに済むよね?
なんで想定すべきと書いたらいけないの?

ここにいる人全員が納得出来る説明を求む
148デフォルトの名無しさん
2024/08/29(木) 23:55:45.32ID:s4c4C/Bz
回答は的確に簡潔に質問に答えることがいちばん
余計な蛇足を加えて悦にいるのは自分が使う分にはいいけど人に指図するものじゃない
ソースコードやスクリプトでも質問もしてないのにあれこれ余分な配慮でコードを複雑にして
いいことをやったと自己満足してる奴にはならないようにしよう
149デフォルトの名無しさん
2024/08/29(木) 23:59:39.42ID:s4c4C/Bz
で、半角空白が含まれるものはあるんかい
この部分は一つだけ実例を示すだけでいいんだよ
存在しえない可能性とやらを配慮するのはまったくの無駄
それは半角空白の変わりにタブコードが含まれる場合に対処しろって言うのと変わらん
150デフォルトの名無しさん
2024/08/30(金) 00:10:46.53ID:z5xrh4P7
>>135で板によっては存在するのは珍しくないとまでいってるんだから
そのリンクを示すだけでいいんだぞ
151デフォルトの名無しさん
2024/08/30(金) 01:14:28.93ID:8cMr2Sm2
141がありもしない難癖ではないことを示すために
メール欄がわざと「 age 」「 sage」の例
http://2chb.net/r/software/1724332370/209-210

空白が入る板とメール欄がわざとでない「 sage」は見たことないな
152デフォルトの名無しさん
2024/08/30(金) 08:58:26.65ID:qASTkovi
そんなにいつまでも続けるネタじゃないだろ
153デフォルトの名無しさん
2024/08/30(金) 13:24:57.13ID:dkGEn5CF
どんぐりの醜い争い
154デフォルトの名無しさん
2024/08/30(金) 17:56:05.65ID:kCrr7PoM
^(s?age|)$でどっちもNGできるわ
>>130でもう出てる
155デフォルトの名無しさん
2024/08/31(土) 12:23:47.01ID:ESY986wz
見たことない == 存在しない

さすがに草
156デフォルトの名無しさん
2024/08/31(土) 16:07:56.33ID:xB9BteZK
こういう専門スレでよくある現象
質問者がいなくなったのに殴り合い始める
157デフォルトの名無しさん
2024/08/31(土) 19:41:26.67ID:ESY986wz
人のちょっとした不手際に噛みつき大騒ぎ
都合が悪いことを言われたらもっともらしいことを言ってごまかす

どこかの知事のマネかねぇ
158デフォルトの名無しさん
2024/09/01(日) 12:11:46.90ID:ruX2CvUf
>>147に対する>>148の回答が面白い

>回答は的確に簡潔に質問に答えることがいちばん

と最初に書いておきながら聞かれたこととはまったく違う回答をしてる
159デフォルトの名無しさん
2024/09/01(日) 12:54:37.81ID:mvzZbYC4
まだやってるのか
よほど悔しかったと見える
160デフォルトの名無しさん
2024/09/02(月) 05:55:02.84ID:zV+ToF23
>>123から半角空白を疑うのは自然な反応だと思うが
20年前のログがあるおっさんがキレる理由が分からんね

論破されて話題のすり替えをして逃げる卑屈な人間でいるより素直に謝ったほうがマシじゃね
てか論破されてることに気付いてなさそう
161デフォルトの名無しさん
2024/09/02(月) 15:51:56.49ID:AlH3f6um
いつ変わってもおかしくないような仕様をなぜそんなに信頼できるのか
…ということを抜きにしても、「実用上十分」かどうかを勝手に決めつけるのは…
というか、>>127 で終わりじゃだめだったのか?
162停止しました。。。
2024/09/02(月) 21:11:06.60ID:uqoOZz2h
真・スレッドストッパー。。。( ̄ー ̄)ニヤリッ
163
2024/09/02(月) 21:44:55.24ID:Y7//7QQC
偽・スレッドストッパー。。。( ̄ー ̄)ニヤリッ
164デフォルトの名無しさん
2024/09/03(火) 00:47:33.48ID:dSkXog9i
内輪もめは巣に帰ってやれや屑共
165デフォルトの名無しさん
2024/09/03(火) 11:11:23.38ID:JwjQ1m/O
次から「>>127に帰れ」でok
向こうにも正規表現作れる人いるみたいだし

知事そっくりのおっさんはしばらく謹慎しとけ
166デフォルトの名無しさん
2024/09/03(火) 11:14:09.37ID:d9bMT2aR
内容的に割と単純かつどうでもいいネタに限って長引く傾向にあるな
167デフォルトの名無しさん
2024/09/03(火) 13:28:50.53ID:FknR0mX7
>>126で終わってるんだよ
補足説明込みでも>>130までで以降は無価値
168デフォルトの名無しさん
2024/09/04(水) 07:40:52.55ID:EbiVCIQx
>>121>>131が空気になっててかわいそうなんだが
誰か構ってやれよ
169デフォルトの名無しさん
2024/09/10(火) 05:40:09.20ID:+qdzMQ7n
質問なのだが、htmlファイルで
<DOCTYPE からつづいて途中にあるAAAをごっそり空欄で置換したいのだが
どうやったらええん
^<DOCTYPE*AAAじゃうまくいかんかったのよねー
170デフォルトの名無しさん
2024/09/10(火) 06:04:34.38ID:kowefQA5
<DOCTYPEEEEEEEEEAAA「ぐわぁ!!
171デフォルトの名無しさん
2024/09/10(火) 14:57:41.04ID:W69Tu2B8
DOCTYPE*は、DOCTYPの後にEが0回以上繰りかえしているものを表すけど本当にそうなってるとは思えん
DOCTYPEEEEEEAAA
172デフォルトの名無しさん
2024/09/11(水) 03:14:10.70ID:qNF+YH3h
昔の仕様をごそっと<!doctype html>に統一したいなら
^<!doctype.*>で置き換えすりゃいいんじゃね、見当違いならごめん
173デフォルトの名無しさん
2024/09/11(水) 07:51:29.11ID:9V6SWpAY
.*>

人に教えていいレベルじゃねぇ
174デフォルトの名無しさん
2024/09/11(水) 08:07:51.41ID:qNF+YH3h
すぐに気づくだろ初心者スレってわけじゃなし
175デフォルトの名無しさん
2024/09/11(水) 08:42:50.99ID:HzXBBqr9
すみません、全部消えました
176デフォルトの名無しさん
2024/09/11(水) 08:45:08.47ID:9UoQOhuf
>>174
無能
177デフォルトの名無しさん
2024/09/11(水) 08:51:56.08ID:4F/AxKNI
またはじまった
こいつほんとにクソやな
178デフォルトの名無しさん
2024/09/11(水) 09:13:11.67ID:qNF+YH3h
そもそもスクリプトなのかエディタなのか
具体的な例も使用方法も書かずに答えが出るわけねえよ
179デフォルトの名無しさん
2024/09/11(水) 13:19:20.05ID:9V6SWpAY
回答は的確に簡潔に質問に答えることがいちばん

>>169
^<DOCTYPE.*?AAA
180デフォルトの名無しさん
2024/09/11(水) 14:41:32.83ID:e/oUHwOW
通常先頭に書くDOCTYPEは
<!DOCTYPE html ~>ってなると思うんだが、!は何処に行った?
さらにAAAとか出てくるか?
AAAがdoctypeと無関係ならその間に改行も挟まってるかもしれんよ
181デフォルトの名無しさん
2024/09/11(水) 15:58:20.52ID:9V6SWpAY
<DOCTYPE
.*?

人に教えていいレベルじゃねぇ
182デフォルトの名無しさん
2024/09/11(水) 16:32:04.44ID:NXAVPXLE
>>181
なんじゃそりゃww
183デフォルトの名無しさん
2024/09/11(水) 18:51:15.50ID:DnMjWL2Z
シングルラインモードでフォルダ内jsonを正規表現でgrep検索できるフリーのテキストエディタ教えて
windowsで動いてGUIしっかりしてる使いやすいのがいい
184デフォルトの名無しさん
2024/09/12(木) 00:04:43.72ID:uYEhMGBt
外部コマンド取り込めてパスからジャンプできるエディタならなんでもいいんでは
vim/neovimとかvscodeとか
185デフォルトの名無しさん
2024/09/12(木) 09:42:50.94ID:71tHR6b6
シングルラインモードと言うと複数行に渡ってマッチさせたいと?
拙者がつこうてるエディタは一行単位でしかマッチ出来なかったでござる
186デフォルトの名無しさん
2024/09/12(木) 10:05:19.60ID:fOf5lfVo
ワイルドカードと性器表現
どうしてこうなったマン心環境の違い
187デフォルトの名無しさん
2024/09/12(木) 11:27:45.34ID:G9h42jpn
>>183
grepとエディタは別々でいいだろ
GUIのgrepソフトは外部エディタを呼べるようになってる(呼べないものって多分無い)
テキストエディタはそれこそ何でも良い
俺はDevasってgrepソフト使ってるがこれも過去に適当に探したものなのでもっといいものがあるかもしれない
188デフォルトの名無しさん
2024/09/12(木) 11:34:30.88ID:G9h42jpn
いや、json限定ならjsonエディタとか使えばいいんじゃなかろうか
189デフォルトの名無しさん
2024/09/12(木) 14:21:47.53ID:iwy8LWRU
>>183
非ascii文字はユニコードエスケープされてる?
190デフォルトの名無しさん
2024/09/12(木) 14:33:20.53ID:G9h42jpn
JSONだから基本UTF-8なんじゃないのか?
191デフォルトの名無しさん
2024/09/12(木) 14:35:15.82ID:G9h42jpn
パーセントエスケープか
あるのとないのと両方あるしなあ
192デフォルトの名無しさん
2024/09/12(木) 14:54:08.26ID:71tHR6b6
北製のエディタ選んでぶっこ抜かれてるやつはいないな?
出所の怪しいやつは避けるんだぞ?
193デフォルトの名無しさん
2024/09/12(木) 16:03:08.30ID:3oNIjHZT
>>184
>>187
ありがとう使ってみる
対象ファイルはUTF8で改行はLFとCF+LF混合(1ファイル内では統一)
日本語2バイト文字はエスケープなしに普通に表記されてる
194デフォルトの名無しさん
2024/09/12(木) 16:55:26.60ID:tplSlOtQ
>>187,193
dnGrepも良い

マッチ箇所の前後数行表示やマッチファイル全体プレビュー表示でサクッと探して
diffとtext editor用の外部コマンドラインを複数登録して使ってる
(有名どころのテンプレートあり)
195デフォルトの名無しさん
2024/09/12(木) 17:00:09.50ID:G9h42jpn
>>193
テキストエディタは何でも良いとは言ったけど
起動引数にファイル名と行位置を指定できるものじゃないと使い物にならない
メモ帳はダメだが大抵大丈夫
196デフォルトの名無しさん
2024/09/12(木) 17:38:37.00ID:G9h42jpn
>>194
良さそうだなと思ったらwin7には無理っぽい(.NET8だとか)
197デフォルトの名無しさん
2024/09/13(金) 06:32:33.01ID:11vS+uA+
>>196
文字エンコーディング自動判別が出来るので、ちょっと古めのcp932とUTF8の混在環境で重宝すると思ったがそれは残念

>>183,193は大丈夫そうだけど(根拠なし)
198デフォルトの名無しさん
2024/09/23(月) 23:23:59.22ID:kDMCxsRj
pcre2の作者さんが後継者探してる
27年続けてきて最近年を感じるようになったとか
199デフォルトの名無しさん
2024/09/26(木) 08:21:09.95ID:JQMFr7dw
老朽ソフトウェアの後継者問題って
需要があれば勝手にメンテされるし無ければ消えるだけだよ
正規表現は時代に合ってないからこの概念ごと消えるかもしれない
200デフォルトの名無しさん
2024/09/26(木) 20:55:23.73ID:DovoaZNg
>>199
正規表現が時代に合ってないってどういうこと?
201デフォルトの名無しさん
2024/09/26(木) 22:02:49.37ID:KgNEnM1+
たぶんだけど自然言語で書く、かな
いまでもコンパイルはしてるし
曖昧な表現だとランタイムエラーになるのはおなじ
202デフォルトの名無しさん
2024/09/26(木) 22:22:27.94ID:ingxpjLa
AIと喋ってろ
203デフォルトの名無しさん
2024/09/29(日) 08:05:17.90ID:rL2U3h48
自然言語を聞いたAIが作るのが正規表現というオチ
既存の正規表現エンジン用の正規表現ではなくAIが生成した正規表現を動かすためだけの
正規表現エンジンも生成される
既存の正規表現エンジンと比べてデータサイズが小さく不要な機能が無いため高速に動作

64コアCPUでテキストデータの64ヶ所を同時に検索
正規表現がテキストにマッチしない場合の速さが2024年時点の通常検索の速さを超えてしまう

野良猫理論: ある限られた空間であちこちをうろつく複数の野良猫が置き餌を見つけるのに
かかる時間は頭数の二乗に反比例するような気がする理論
204デフォルトの名無しさん
2024/10/01(火) 11:39:53.35ID:Z3sXryIq
>>203
>野良猫理論:
なるほど、そうかも
205デフォルトの名無しさん
2024/10/01(火) 11:45:14.33ID:v9xyba12
>>203
妄想はAIとすれば捗るぞ
206デフォルトの名無しさん
2024/10/06(日) 00:20:41.41ID:YLpbtiCB
DFA 「NFA、僕は君のことをクリーネ閉方したい」
NFA 「受理できません」
207デフォルトの名無しさん
2024/10/08(火) 20:25:00.73ID:2vPrSKyO
久しぶりにプログラム板にきました
あるwebサイトのたとえばx0000からx99999までのurl内それぞれ個別にあるたとえば日付等の項目を
すべてカンマ区切りで抜き出す正規表現を考えようとしましたが
結局、項目が10個まであるわけじゃないので
<!DOCTYPE.*ほにゃらら項目、ほにゃらら項目…ほにゃらら項目、ほにゃらら*</html>
てのを10まであるわけじゃない項目分それぞれ抜き出しました
本来なら、 項目,項目,項目…… で抜き出せるように一発で正規表現使えば何とかなるのでしょうけれど、
項目だけの列といいましょうかx0000の項目Aからx9999の項目Aをまずだして
次にx0000の項目Bからx9999の項目Bを次に出してと
結局その項目が10までとはいかないけれどその分をだして表計算ソフトにつっこんだわけです
結果できましたがどうにも納得がいきません

正規表現が出来ればきっとっとも楽に時間もかからずできたのでしょう

JaneXeno質問スレ9
http://2chb.net/r/software/1722559511/
いまこのスレにいたりもします。
208デフォルトの名無しさん
2024/10/08(火) 22:03:57.17ID:XPh9YV+I
>>207
1. まず日本語を整理する能力を身につけましょう
2. 次にテストケースを整理する能力を身につけましょう
3. そして1.と2.で身につけた能力を使ってChatGPTに問い合わせましょう

さすれば望む答えが楽に得られます
209デフォルトの名無しさん
2024/10/09(水) 01:44:24.09ID:WkCTujRI
ここは野良猫理論を数学的に証明するスレになりました
210デフォルトの名無しさん
2024/10/09(水) 02:26:53.03ID:LpRCWPua
すごく読み難いし目的も読み取れない
終わってる
211デフォルトの名無しさん
2024/10/09(水) 03:04:13.75ID:w53uZCE9
頑張って2回読んだけど何のアドバイスもできそうにない
212デフォルトの名無しさん
2024/10/09(水) 05:04:10.76ID:z5soGBkc
Excel VBA 質問スレ Part81
とやらにいる障害者みたいだね
213デフォルトの名無しさん
2024/10/09(水) 09:59:45.33ID:nVMNMgni
DOCTYPE全然関係なかったんやな
>>180がアタリ
>>179,181はハズレ
214デフォルトの名無しさん
2024/10/09(水) 12:56:32.38ID:WkCTujRI
とりあえずxenoをあぼーん登録しといた
215デフォルトの名無しさん
2024/10/10(木) 13:27:21.21ID:WHQFPCFe
そういえばこのスレが伸びたのも発端は>>120だったな
>>120みたいな難問を気軽に質問されたら困る
216デフォルトの名無しさん
2024/10/12(土) 15:23:11.12ID:gMUOKJHq
●Regular Expressionの使用環境
VS Code 1.94.2 の検索バー

●検索か置換か?
置換

●説明
htmlファイルを開いている。
href属性が .css で終わらない場合に属性値を空文字列へ置換したい。
href="[^"]+(?!\.css)"を検索したが .css で終わっていてもマッチしてしまう。

●対象データ
<a href="URL.css">link</a>
<a href="a.html">link</a>
<link rel="stylesheet" href="a.css">
<link rel="stylesheet" href="b">

●希望する結果
<a href="URL.css">link</a>
<a href="">link</a>
<link rel="stylesheet" href="a.css">
<link rel="stylesheet" href="">
217>>216
2024/10/12(土) 15:33:12.91ID:gMUOKJHq
原理はよくわかりませんが自己解決しました
href="[^"]+(?<!\.css)"
218デフォルトの名無しさん
2024/10/12(土) 16:13:01.24ID:qxhXc26A
href="[^"]+(?!\.css)"

<a href="URL.css">link</a>で"[^"]+の最後の文字はs
つまりsの位置では.cssではないのでマッチする
219デフォルトの名無しさん
2024/10/12(土) 16:15:48.04ID:qxhXc26A
sの後ろ(つまり")の位置に訂正
220デフォルトの名無しさん
2024/10/12(土) 17:58:39.21ID:hwVWGPYm
正規表現関係ないけどhtmlタグ周りの操作は
できるだけDOM経由でやっておいたほうが楽で安全だと思う

htmlの書き方がみんな揃ってるとは限らないし
<div>href="foo"</div>とかlocation.href=“bar”にはマッチしないようにするとか
いろいろ考慮ポイントが増えてミスするリスクも高くなる

DOM経由でやっておけばその辺は安心
document.querySelectorAll("[href]:not([href$='.css'])").forEach(x=>x.setAttribute("href", ""))
221デフォルトの名無しさん
2024/10/13(日) 15:34:10.31ID:josLIOo8
>>217
それ大正解だよ、すごい
それ以上のものを作れと言われたら大抵の人は悩む
というか>>217の答えに辿り着けない人が多数かと
222デフォルトの名無しさん
2024/11/02(土) 23:35:42.52ID:5ILrPZJU
正規表現のオペレータの分類についての質問です
assertionにアンカーやバウンダリを含める分類はあまり見かけませんが何故でしょう?(例dotnet文書)

以下(多分regex界で著名な)参考サイトより引用
Assertions. The traditional regular expression metacharacters ^ and $ can be viewed as assertions about the text around them: ^ asserts that the previous character is a newline (or the beginning of the string), while $ asserts that the next character is a newline (or the end of the string). Perl added more assertions, like the word boundary \b, which asserts that the previous character is alphanumeric but the next is not, or vice versa.
https://swtch.com/%7Ersc/regexp/regexp1.html

確かにマッチに含まれないという意味ではよくassertionであると言われるlookback/aheadと同様です
何か含めないことで利点があるのでしょうか?
223デフォルトの名無しさん
2024/11/09(土) 12:53:50.15ID:k7Zpjetb
これに答えられる人はここに数人いるかどうかなのでは
(私はもちろん答えられません)

勘で答えるなら先読み、後読みは後から出てきたものなので元からあった
^ $ \b とは別物扱いになった、とかですかね?すみません、分かりません
224デフォルトの名無しさん
2024/11/09(土) 21:56:49.21ID:f+X68XQj
(ゼロ幅)アサーションには含まれる、(ルックアラウンド)アサーションには含まれない

でもルックアラウンドアサーションだけを指して単にアサーションと呼ぶなんてことがあるかな、大体何か修飾語がついてるよね?
単にアサーションと呼ばれるのはゼロ幅アサーションの方だと思う
実際参考サイトもそんな感じだろう知らんけど
225デフォルトの名無しさん
2024/11/19(火) 12:37:58.18ID:UdPT9kjC
Google spreadsheetでREGEXREPLACE関数で置換するやり方を教えていただけないでしょうか
実行したい内容は以下の通りです。

●Regular Expressionの使用環境
Google spreadsheet

●検索か置換か?
置換

●説明
英文の各単語の先頭1文字以外をアスタリスクに置換したい
カンマとピリオドとハテナは置換しない
アポストロフィは置換する

●対象データ
Oh, it’s sunny today.
Do you understand?

●希望する結果
O*, i*** s**** t****.
D* y** u*********?
226デフォルトの名無しさん
2024/11/19(火) 13:15:50.46ID:qWVXBGcO
俺の知識の範囲では正規表現だけでは不可能
227デフォルトの名無しさん
2024/11/19(火) 13:28:40.67ID:TpNNC8ku
その環境がわからんので一般的な場合として
/(?<=[^ ,.?\n\r])[^ ,.?\n\r]/*/g
/(?<=[a-z’'])[a-z’']/*/ig
228デフォルトの名無しさん
2024/11/19(火) 13:45:50.24ID:qWVXBGcO
なるほど。後読を使えばいいのか
229デフォルトの名無しさん
2024/11/19(火) 14:33:47.46ID:UdPT9kjC
後読はこの関数では使えないようなのですが、関数ではなくて置換機能なら使えるようなので試してみます!
ありがとうございました!!
230デフォルトの名無しさん
2024/11/19(火) 15:02:42.11ID:TpNNC8ku
The problem is the ’XXX’.
こういうのはあるのかな?
231デフォルトの名無しさん
2024/11/19(火) 15:19:15.00ID:TpNNC8ku
>>228
正規表現のどの文法を使うかじゃなくて、どういう論理にするかを思いつくかどうかだから
(とんちクイズと一緒で発想力の問題)
なお230のようなケースがあるのならおそらく再起を使う必要がでてくると思う
232デフォルトの名無しさん
2024/11/19(火) 15:56:13.16ID:UdPT9kjC
>>230
これは想定していなかったですが今回はなさそうです
233デフォルトの名無しさん
2024/11/19(火) 17:34:15.15ID:G+8Uvgpo
Apps Script使うのがシンプルなこともある
234デフォルトの名無しさん
2024/11/19(火) 23:06:51.29ID:TpNNC8ku
/(?<=[a-z]|[a-z]')[a-z]|(?<=[a-z])'(?=[a-z])/*/ig
(アポストロフィは半角のみにしてる)
This is the 'Tom's Home'.
→ T*** i* t** 'T**** H***'.

無理ーー
'Rock'n'Roll' is "Rock 'n' Roll". → 'R**********' i* "R*** 'n' R***".
'' is NULL strings. → '' is NULL strings.
235デフォルトの名無しさん
2024/11/20(水) 17:07:45.94ID:vf/ffllo
regexpは数学(キリっ
236デフォルトの名無しさん
2024/11/20(水) 17:38:18.40ID:ibyj9elY
ウザっ

lud20241212061719
このスレへの固定リンク: http://5chb.net/r/tech/1702684760/
ヒント:5chスレのurlに http://xxxx.5chb.net/xxxx のようにbを入れるだけでここでスレ保存、閲覧できます。

TOPへ TOPへ  

このエントリをはてなブックマークに追加現在登録者数177 ブックマークへ


全掲示板一覧 この掲示板へ 人気スレ | Youtube 動画 >50 >100 >200 >300 >500 >1000枚 新着画像

 ↓「Regular Expression(正規表現) Part17 」を見た人も見ています:
Regular Expression(正規表現) Part14
■■■レクサス LEXUS UX Part28 (正規) ■■
■■■レクサス LEXUS UX Part21 (正規) ■■■
『2017 PlayStation® Press Conference in Japan』9月19日(火)開催!
【PRESIDENT Online】 「つい育ちが出てしまう」知らないと恥ずかしい"下品なお箸の持ち方" [朝一から閉店までφ★]
【LIVE】墜落寸前!中国の天宮1号の軌道予測 April 1st, 2018 23:53 UTC ± 7 hours. that is the latest prediction.
ロレDiffusionBrandの正規店マラソンスレ
【正規スレ】【PS5】RDNA2X SIE次世代機卵zスレ HWRT 高速SSD アンチ出禁 83世代目 【PS5PRO】
【中下位専用】ENGLAND Premier League 33
SignalNow Express関連ツール[4ツール目]
【中下位専用】ENGLAND Premier League 31
War responsibility of Communist, Comintern
Ali expressでこれだけは買っておけって釣具 ※中国版Amazon 世界中で大人気 [無断転載禁止]
Aliexpress、ebay、米Amazon…  世界的通販サイトによって日本企業が徐々に淘汰されている [無断転載禁止]
【PC】個人なら無償 インテルMac用仮想環境アプリ「VMware Fusion Player 12」 [田杉山脈★]
【朗報】PC版"Fallout 4" 表現規制なし・Steam版の日本語対応・独自exeなしが確定
NEC Express5800/S70 RB&PJ&SR 126本目 【鼻毛】
NEC Express5800/S70 RB&PJ&SR 133本目【鼻毛鯖】
NEC Express5800/S70 RB&PJ&SR 131本目 【鼻毛】
NEC Express5800/S70 RB&PJ&SR 130本目 【鼻毛】 [無断転載禁止]
NHK BS1 8428 (正規)
B's DVD professional
KING OF PRISM Session21
【祝!パヨクに英語名定着】蓮舫民進党等研究第52弾【professional protesters】
【努力】【期待値】リアルプロ professional2【収支】【ハイエナ】 [無断転載禁止]
オイラのアナルはprogressive
Slay the Spire Ascension27
Slay the Spire Ascension18
Slay the Spire Ascension13
【SONY】THE世界遺産 7【PRESENTS】
DIVISION REBEL TACKLES 7年待ち
DIVISION REBEL TACKLES 6年待ち
Foreign IP regulations temporarily removed.
PHANTASY STAR ONLINE 2 NEW GENESIS【1】
ポケモン新作発表会 Pokémon Presents 実況スレ
詐欺まがい!マルチもどきの株式会社Presidentを野放しにするな
ASUS ZenFone 2 Laser ZE500KL SIMフリー Part15 [無断転載禁止]
∴ξ∵ξ∴PRESIDENT...TRUMP201611121650∵ξ∴ξ∵【本スレ】 [無断転載禁止]
【 #立憲民主党 】 #有田芳生 氏「FUCK YOU VERY MUCH PRESIDENT TRUMP」をリツイート
「ウイルスの発生源は中国ではない」と訴える中国のキャンペーンが再び活発に 現地調査を求めるオーストラリアに強く反発(JBpress) [Felis silvestris catus★]
【パヨク悲報】有田芳生さんがリツイート「F○CK YOU VERY MUCH PRESIDENT TRUMP」 Part2
ソニー IFA 2016 プレスカンファレンス(IFA 2016 Sony Press Conference) [無断転載禁止]
Tehu君、ついに英語アピールで嫌儲民に反撃 「Presidential Debate のファクトチェック。この仕組み本当にすごい。」
【社会】 安倍さん見て見ぬふり「実質賃金下落」「正社員カースト制度」~2014人事関連重大NEWS(前) [PRESIDENT]
日本の安全を脅かす日本学術会議 防衛省の事業には協力しないが、人民解放軍と密接な関係にある中国企業とは協力… JBpress [Felis silvestris catus★]
もの凄い勢いで誰かが質問に答えるスレ53http://lavender.2ch.net/test/read.cgi/siki/1496766583/ [無断転載禁止]
Node.js + Express
海外通販 AliExpress 98
海外通販 AliExpress 16
海外通販 AliExpress 80
海外通販 AliExpress 66
海外通販 AliExpress 84
海外通販 AliExpress 109
海外通販 AliExpress 83
海外通販 AliExpress 126
AliExpressで購入 ©bbspink.com
海外通販 AliExpress 119
海外通販 AliExpress 57
海外通販 AliExpress 61
海外通販 AliExpress 147
海外通販 AliExpress 63
海外通販 AliExpress 156
海外通販 AliExpress 118
海外通販 AliExpress 77
海外通販 AliExpress 141
09:48:26 up 65 days, 10:47, 0 users, load average: 8.10, 8.09, 8.49

in 0.027575969696045 sec @0.027575969696045@0b7 on 062122