Отправляет email-рассылки с помощью сервиса Sendsay
  Все выпуски  

Парсер. Поиск по фрагменту HTML кода.



Software-Testing.Ru - портал тестировщиков  

Новые темы форума тестировщиков


Парсер. Поиск по фрагменту HTML кода.
2015-01-02 00:07

Доброго времени суток !

 

Есть сайт с альбомами в mp3. Но скачивать можно только по одной песне.
Хочу написать что-то типа парсера, который сформирует ссылки для менеджера закачек.
Возможно ли это сделать на Selenium IDE ?

Страница имеет вид:


<html>
   ... много  тегов ...

   <a href="/track/2881111/mp3/almost_like_the_blues/">Almost Like The Blues</a><br>

   ... много тегов ...

   <a href="/track/28832222/mp3/samson_in_new_orleans/">Samson In New Orleans</a><br>

   ... много тегов ...

</html>


Для менеджера закачек ссылка "/track/2881111/mp3/almost_like_the_blues/" должна преобразоваться
в строку "www.musicsite.ru/download.php?id=2881111"

Т.е. каким-то образом (регулярные выражения ?) надо
1) найти все строки,
   начинающиеся с   <a href="/track/
   и заканчивающиеся на </a><br>
2) и сохранить их в переменную, а потом в файл.

Тыкните, плиз, в команды.

Или может, есть другие возможности решить эту задачу, но не ставя громоздкие С++ , PHP ?

 



© 2010 | Software-Testing.Ru


В избранное