jjzjj

Java Regex 从 HTML anchor (<a>...</a>) 标签获取文本

我正在尝试获取某个标签内的文本。所以如果我有:Found我希望能够检索Found文本。我正在尝试使用正则表达式来做到这一点。如果我能做到保持不变,但事实并非如此。到目前为止我有这个:PatterntitleFinder=Pattern.compile(".*[a-zA-Z0-9]*([a-zA-Z0-9]*).*");我认为最后两部分-([a-zA-Z0-9]*).*-没问题,但我不知道第一部分该做什么。 最佳答案 正如他们所说,不要使用正则表达式来解析HTML。不过,如果您意识到这些缺点,您可能会侥幸逃脱。尝试Patterntit

java - 如何在 Java 8 (Scala) 中将日期时间字符串转换为长(UNIX 纪元时间)

我想要一些pattern中的字符串的UNIX纪元时间(Posix时间,Unix时间),该字符串是正常格式(所以是UTC)。请使用Java8,而不是Joda或旧的Java。(毫秒请参见Howtoconvertadatetimestringtolong(UNIXEpochTime)MillisecondsinJava8(Scala))到目前为止,我有以下内容,但出于多种原因我讨厌它:对于最常见的日期处理(转换为UNIX大纪元时间)而言,它过于冗长了。7方法调用应该是1。它必须指定UTC,但UTC肯定只是默认值,为什么我必须在这里明确说明?它有一个字符串文字"UTC"它有一个神奇的数字Zon

java - 模式中的规范等价

我指的是此处列出的测试工具http://docs.oracle.com/javase/tutorial/essential/regex/test_harness.html我对类所做的唯一更改是模式创建如下:Patternpattern=Pattern.compile(console.readLine("%nEnteryourregex(Pattern.CANON_EQset):"),Pattern.CANON_EQ);作为http://docs.oracle.com/javase/tutorial/essential/regex/pattern.html的教程建议我将模式或正则表达式作

java - 我有一些关于 Java 编译器的问题

我有一些关于Java编译器的问题。我的当前目录是这样的├──Hoge.java├──Sample.class├──Sample.java├──pattern01│  └──com│  └──cat│  └──Hoge.class└──pattern02└──com└──cat└──Hoge.class-----示例.java-----importcom.cat.Hoge;publicclassSample{publicstaticvoidmain(String[]args){System.out.println("hello!");Hogeh=newHoge();h.call();}}

java - 我的正则表达式导致 Java 中的堆栈溢出;我错过了什么?

我正在尝试将正则表达式与Scanner结合使用来匹配文件中的字符串。正则表达式适用于文件的所有内容,除了这一行:DNA="ITTTAITATIATYAAAYIYI[....]ITYTYITTIYAIAIYIT"在实际文件中,省略号代表几千个字符。当读取文件的循环到达包含碱基的行时,发生堆栈溢出错误。这是循环:while(scanFile.hasNextLine()){finalStringcurrentLine=scanFile.findInLine(".*");System.out.println("tryingtomatch'"+currentLine+"'");Scannerin

Java Regex 在匹配中包含新行

我正在尝试将正则表达式与我从网站获得的教科书定义相匹配。定义总是包含带有新行的单词,后跟定义。例如:ZitherDefinition:AninstrumentofmusicusedinAustriaandGermanyIthasfromthirtytofortywiresstrungacrossashallowsoundingboardwhichlieshorizontallyonatablebeforetheperformerwhousesbothhandsinplayingonitNottobeconfoundedwiththeoldluteshapedcitternorcithe

java - 函数式 java.util.regex 匹配/组提取

使用java.util.regex提取子字符串我发现自己实现了相同的代码模式来解决调用:Patternp=Pattern.compile(pattern);//canbestaticfinalMatcherm=p.matcher(input);if(m.find()){//orm.matches()foo(m.group(x));}else{...}是否有功能扩展或流行的库(guava/apachecommons)可以避免丑陋的不必要且容易出错的局部变量,例如:Patternp=Pattern.compile(pattern);//canbestaticfinalp.matchedGr

Java : does regex pattern matcher have a size limit?

我的模式是OR-like:“word1|word2|word3”我有大约800个单词。这会是个问题吗? 最佳答案 您仅受内存和理智的限制。:) 关于Java:doesregexpatternmatcherhaveasizelimit?,我们在StackOverflow上找到一个类似的问题: https://stackoverflow.com/questions/6358387/

Java 的正则表达式不将其他语言的字符识别为单词字符(即\w)

假设我有一个词:“Aiavärav”。表达式\w+应该捕获这个词,但是字母“ä”将这个词减半。我得到的不是“Aiavärav”,而是“Aia”。包含那些非ascii字母的单词的正确正则表达式是什么? 最佳答案 根据thedocumentation,\w仅匹配[a-zA-Z_0-9]除非您指定UNICODE_CHARACTER_CLASS标志:Pattern.compile("\\w+",Pattern.UNICODE_CHARACTER_CLASS)或者在模式中嵌入一个(?U):Pattern.compile("(?U)\\w+")

Java 正则表达式字边界

您好,我有以下代码,用于查找“is”一词,但当它位于另一个字符串中时则无法查找,因此“this”一词不应返回匹配项,因此我使用\b。但是下面的代码没有找到匹配项,我不明白为什么?publicstaticvoidmain(String[]args){Stringa="Thisislandisbeautiful.";Patternp=Pattern.compile("\bis\b");Matcherm=p.matcher(a);while(m.find()){System.out.println(a.substring(m.start(),m.end()));}}