[TruyenHentai18] Fix getPages

9 months ago · 9995657da5
parent d0b2002a1b 1569275cd4
commit 9995657da5
2 changed files with 32 additions and 49 deletions
--- a/src/main/kotlin/org/koitharu/kotatsu/parsers/site/all/MyReadingManga.kt
+++ b/src/main/kotlin/org/koitharu/kotatsu/parsers/site/all/MyReadingManga.kt
@ -1,13 +1,11 @@
 package org.koitharu.kotatsu.parsers.site.all
 import androidx.collection.ArraySet
 import org.jsoup.nodes.Document
 import org.jsoup.nodes.Element
 import org.koitharu.kotatsu.parsers.MangaLoaderContext
 import org.koitharu.kotatsu.parsers.MangaSourceParser
 import org.koitharu.kotatsu.parsers.config.ConfigKey
 import org.koitharu.kotatsu.parsers.core.PagedMangaParser
 import org.koitharu.kotatsu.parsers.exception.ParseException
 import org.koitharu.kotatsu.parsers.model.*
 import org.koitharu.kotatsu.parsers.util.*
 import java.text.SimpleDateFormat
--- a/src/main/kotlin/org/koitharu/kotatsu/parsers/site/vi/TruyenHentai18.kt
+++ b/src/main/kotlin/org/koitharu/kotatsu/parsers/site/vi/TruyenHentai18.kt
@ -1,9 +1,7 @@
 package org.koitharu.kotatsu.parsers.site.vi
 import org.json.JSONArray
 import org.json.JSONObject
 import org.jsoup.nodes.Document
 import org.jsoup.Jsoup
 import org.koitharu.kotatsu.parsers.MangaLoaderContext
 import org.koitharu.kotatsu.parsers.MangaSourceParser
 import org.koitharu.kotatsu.parsers.config.ConfigKey
@ -13,9 +11,7 @@ import org.koitharu.kotatsu.parsers.util.*
 import org.koitharu.kotatsu.parsers.util.json.*
 import java.text.SimpleDateFormat
 import java.util.*
 import org.koitharu.kotatsu.parsers.Broken
@Broken
@MangaSourceParser("TRUYENHENTAI18", "TruyenHentai18", "vi", ContentType.HENTAI)
 internal class TruyenHentai18(context: MangaLoaderContext):
 	PagedMangaParser(context, MangaParserSource.TRUYENHENTAI18, 18) {
@ -83,11 +79,10 @@ internal class TruyenHentai18(context: MangaLoaderContext):
 			}
 		}
 		val fullUrl = "https://" + url
 		return when {
-			filter.tags.isNotEmpty() -> parseNextList(webClient.httpGet(fullUrl).parseHtml())
+			filter.tags.isNotEmpty() -> parseNextList(webClient.httpGet("https://$url").parseHtml())
 			else -> {
-				val doc = webClient.httpGet(fullUrl).parseJson()
+				val doc = webClient.httpGet("https://$url").parseJson()
 				parseJSONList(doc)
 			}
 		}
@ -234,25 +229,19 @@ internal class TruyenHentai18(context: MangaLoaderContext):
 	override suspend fun getPages(chapter: MangaChapter): List<MangaPage> {
 		val doc = webClient.httpGet(chapter.url.toAbsoluteUrl(domain)).parseHtml()
 		val scriptContent = doc.select("script")
-	            .firstOrNull { it.data().startsWith("self.__next_f.push([1,\"\\u003cp\\u003e\\u003c") }
+			.firstOrNull { it.data().contains("img src") }
 			?.data()
 			?: return emptyList()
-	        if (scriptContent != null) {
+		val decoded = scriptContent
 	            val regex = Regex("""self\.__next_f\.push\(\[1,\"(.*)\"\]\)""")
 	            val htmlEncoded = regex.find(scriptContent)?.groupValues?.getOrNull(1)
 	            if (!htmlEncoded.isNullOrEmpty()) {
 	                val html = try {
 	                    JSONArray("[\"$htmlEncoded\"]").getString(0)
 	                } catch (e: Exception) {
 	                    htmlEncoded
 			.replace("\\u003c", "<")
 			.replace("\\u003e", ">")
 			.replace("\\\"", "\"")
 			.replace("\\/", "/")
 	                }
-	                val imageUrls = Jsoup.parse(html).select("img").mapNotNull { it.attr("src") }
+		val regex = Regex("""img\s+src=["'](https?://[^"']+)["']""")
-	                if (imageUrls.isNotEmpty()) {
+		val imageUrls = regex.findAll(decoded).map { it.groupValues[1] }.toList()
 		return imageUrls.map { url ->
 			MangaPage(
 				id = generateUid(url),
@ -261,10 +250,6 @@ internal class TruyenHentai18(context: MangaLoaderContext):
 				source = source,
 			)
 		}
 	                } else return emptyList()
 	            }
 	        }
 	        return emptyList()
 	}
 	private fun parseChapterDate(date: String?): Long {