[B! phantomjs] bigchuのブックマーク

javascript - Android - Parse JS generated urls with JSOUP - Stack Overflow

bigchu 2018/06/30

リンク

Seleniumアレルギーのための処方箋 - Qiita

何年も前、SeleniumやWebDriverの話で盛り上がった記憶があります。ただ、その当時はまだRailsなどバックエンド中心の文脈でした。今、フロントエンドに軸足が移る中、ブラウザテストの状況はどうなったのでしょう? 不思議なことに、フロントエンド界隈でそれほど話題に上がって来ないですよね (私の周りだけ?)。結構大事なのに。実は皆さん、「Seleniumアレルギー」なんじゃないですか? 公式サイトに漂うゼロ年代感(下図)。Javaへの躊躇、「めんどくさい」と聞かされ続けた過去、無意識に避けてしまうのがSeleniumです。ただ、フロントエンドの文脈でこそ、ブラウザテストは重要度を増しています。そこで「Selenium触りたくない病」の筆者が、四苦八苦した背景と、2016年だからこそ見えてきた落とし所を書いてみたいと思います。註: 思ったより長文になってしまいました。先

bigchu 2018/05/20

: Selenium

リンク

PythonでWebスクレイピングする時の知見をまとめておく - Stimulator

- はじめに - 最近はWebスクレイピングにお熱である。趣味の機械学習のデータセット集めに利用したり、自身のカードの情報や各アカウントの支払い状況をスクレイピングしてスプレッドシートで管理したりしている。最近この手の記事は多くあるものの「～してみた」から抜けた記事が見当たらないので、大規模に処理する場合も含めた大きめの記事として知見をまとめておく。追記 2018/03/05：大きな内容なのでここに追記します。 github.com phantomJSについての記載が記事内でありますが、phantomJSのメンテナが止めたニュースが記憶に新しいですが、上記issueにて正式にこれ以上バージョンアップされないとの通達。記事内でも推奨していますがheadless Chrome等を使う方が良さそうです。 - アジェンダ - 主に以下のような話をします。 - はじめに - - アジェンダ

bigchu 2018/05/18

リンク

Archiving the project: suspending the development · Issue #15344 · ariya/phantomjs

Due to the lack of active contribution, I am going to archive this project soon. At some point in the future, if we pick up the development again (such as #15341, #15342, #15343), the project will be unarchived. With that, all the earlier plans regarding PhantomJS 2.5 (from @vitallium) or 2.1.x (from @pixiuPL) will be abandoned effective immediately. Consequently, the source and binary packages fo

bigchu 2018/05/18

リンク

Javaですべての上場企業のと地方自治体のサイトをスクレイピングして大変だったこと - Qiita

Deleted articles cannot be recovered. Draft of this article would be also deleted. Are you sure you want to delete this article? 私は主にJavaを使って大量のサイトからクロールとスクレイピングをしています。作っているサイトは happyou.info です。上場企業と官公庁と地方自治体とその他1万サイトくらいスクレイピングしています。このエントリでは、技術的なこと特にめんどうくさかった点を書き残しておきたいと思います。基本的なことかもしれませんが、私自身忘れそうなところもあるので。 1.上場企業は企業が入れ替わる上場企業は毎日企業が入れ替わります。新規上場、上場廃止、合併、分社化、企業名変更は毎日のことです。この変化にキャッチアップするのが難しかったです。

bigchu 2018/05/18

リンク

PHP PhantomJS

PHP PhantomJS is a flexible PHP library to load pages through the PhantomJS headless browser and return the page response. It is handy for testing websites that demand javascript support and also supports screen captures and PDF output. Feature List Load webpages through the PhantomJS headless browser View detailed response data including page content, headers, status code etc. Handle redirects Vi

bigchu 2018/05/16

リンク

How to install PhantomJS on CentOS/RHEL

bigchu 2018/05/16

リンク

How to Install PhantomJS on Ubuntu 16.04

bigchu 2017/08/15

: サーバ用

リンク

Ninja 2.0.0 released!

bigchu 2017/04/14

らめぇ...

phantomjs

リンク

API Reference WebPage

You signed in with another tab or window. Reload to refresh your session. You signed out in another tab or window. Reload to refresh your session. You switched accounts on another tab or window. Reload to refresh your session. Dismiss alert

bigchu 2013/08/28

リンク

Home

You signed in with another tab or window. Reload to refresh your session. You signed out in another tab or window. Reload to refresh your session. You switched accounts on another tab or window. Reload to refresh your session. Dismiss alert

bigchu 2013/06/21

:

リンク

GitHub - amir20/phantomjs-node: PhantomJS integration module for NodeJS

You signed in with another tab or window. Reload to refresh your session. You signed out in another tab or window. Reload to refresh your session. You switched accounts on another tab or window. Reload to refresh your session. Dismiss alert

bigchu 2013/06/21

リンク

PhantomJS - Passing Variables to page.evaluate ★ me.dt.in.th

bigchu 2013/06/04

: evaluate に変数がっちんこする方法

phantomjs

リンク

Node.js × PhantomJS で何でもサクサクスクレイピングするよ！ - 凹みTips

はじめに先日、PhantomJS でログインが必要なページでも自由自在にスクレイピング - 凹みTips という記事を書きました。前回は PhantomJS のみを用いてスクレイピングを行なっていましたが、スクレイピングした結果を使って色々やりたい！となると、Node.js の力を借りたくなってきます。単純に取得した HTML を利用するだけなら、PhantomJS の fs モジュールを使って HTML をファイルに書き出し、これを Node.js で読み取って…、なんてことをすれば可能ですが、何かしらの入力を受けて動的にページを遷移したい、となると厳しくなってきます。そこで、本エントリでは PhantomJS を Node.js から使って色々出来るよ！ということを解説したいと思います。利用するモジュール PhantomJS をラップした Node モジュールは沢山あります。試

bigchu 2013/06/04

リンク

CoffeeScriptを利用したPhantom.jsのevaluateで「ReferenceError: Can't find variable: __slice」となる問題 - blue_ham_cake1024のブログ

原因 Phantom.jsのpage.evaluateに渡す関数は外側のスコープの変数を利用できないのに、CoffeeScriptのコンパイラが外側のスコープの変数を利用する関数を生成してしまうため。対策次のような関数を利用することでpage.evaluateに渡す関数が変数を自身のスコープ内のみで解決できるようにする。 toBeExecutableInBrowser = (func) -> str = func.toString().replace /\n/, '\n var __slice = [].slice;\n' eval "(#{str})" あるいは次のようにしてpage.evaluateの動作を変更し、ブラウザ内に__sliceという変数を事前に定義するようにしておく。 do () -> evaluate = page.evaluate page.evaluate =

bigchu 2013/06/04

リンク

PhantomJS でログインが必要なページでも自由自在にスクレイピング - 凹みTips

はじめに PhantomJS - Scripta ble Headless Browser PhantomJS はヘッドレスな（ブラウザ画面のない）QtWebKit ベースのブラウザで、JavaScript の API を通じて、そのブラウザを自由自在にあやつることが出来ます。使用シーンとしては、Jenkins などの CI ツールとの組み合わせによる Web ページの GUI の自動テストや、Web ページのスクリーンキャプチャ、スクレイピングなどが挙げられます。今回は、ログインが必要なページの情報をパースして自分専用に RSS 化したいなと思い、３つ目のスクレイピング用途をベースに調べてみました。その内容を備忘録として残しておきます。出来るようになることログインが必要なページの HTML を取ってくるログインが必要なページのスクリーンキャプチャを撮る PhantomJS の導入

bigchu 2013/06/04

: これだ！

リンク

はてなブックマーク

タグ

関連タグで絞り込む (15)

phantomjsに関するbigchuのブックマーク (16)

お知らせ

今週のはてなブックマーク数ランキング（2025年3月第3週）

今週のはてなブックマーク数ランキング（2025年3月第2週）

月間はてなブックマーク数ランキング（2025年2月）

公式Twitter

キーボードショートカット一覧

はてなブックマーク

公式Twitter

はてなのサービス