fixed correctly the way to retrieve all mp3s
[radio.git] / mp3tohtml.py
index 370cb1f..a683c88 100755 (executable)
@@ -1,4 +1,4 @@
-#!/usr/bin/python
+#!/usr/bin/python2
 
 # Generate an HTML page containing information about MP3s in a
 # directory.
 #
 # (c) 2016 Jean-Philippe Orsini  <jeanfi@gmail.com>
 
+import argparse;
 import eyeD3
+import fnmatch
 import glob
+import os
 import os.path
 import re
 import sys
 
-def fma_copyright_to_html(copyright):
+def fma_copyright_to_html(path, copyright):
+    if copyright == "":
+        sys.stderr.write(path + ": no FMA copyright.\n")
+        return ""
+
     p = re.compile("(.*): (.*)")
     m = p.match(copyright)
     if m is not None:
@@ -24,46 +31,45 @@ def fma_copyright_to_html(copyright):
         name = name.replace("Creative Commons", "CC")
         name = name.replace("Attribution", "BY")
         name = name.replace("NonCommercial", "NC")
+        name = name.replace("Noncommercial", "NC")
         name = name.replace("NoDerivatives", "ND")
         name = name.replace("ShareAlike", "SA")
+        name = name.replace("Share Alike", "SA")
+        name = name.replace("United States", "US")
         return "<a href=\"" + m.group(2) + "\">" + name + "</a>"
     else:
+        sys.stderr.write(path + ": invalid FMA copyright: "
+                         + copyright + ".\n");
         return copyright
 
-if len(sys.argv) != 2:
-    sys.stderr.write("Usage: mp3tohtml.py <mp3_dir>\n")
-    exit(1)
+def copy_header(path):
+    header_path = os.path.dirname(path) + "/header.tpl"
+    header = open(header_path, "r")
+    for line in header:
+        sys.stdout.write(line)
+
+parser = argparse.ArgumentParser(description='Generate an HTML containing information about the MP3 files.')
+parser.add_argument('dir', help='The directory containing the MP3 files')
+
+args = parser.parse_args()
 
-header_path = os.path.dirname(sys.argv[0]) + "/header.tpl"
-header = open(header_path, "r")
-for line in header:
-    sys.stdout.write(line)
+copy_header(sys.argv[0])
 
-files = glob.glob(sys.argv[1] + "/**/*mp3")
+files = []
+for root, dirnames, filenames in os.walk(args.dir):
+    for filename in fnmatch.filter(filenames, '*.mp3'):
+        files.append(os.path.join(root, filename))
 
 for f in files:
     tag = eyeD3.Tag()
 
     tag.link(f)
 
-    print "\t<tr>"
-
-    try:
-        artist = tag.getArtist()
-        print "\t\t<td>" + artist + "</td>"
-    except UnicodeEncodeError:
-        print "\t\t<td></td>"
-
-    try:
-        print "\t\t<td>" + tag.getAlbum() + "</td>"
-    except UnicodeEncodeError:
-        print "\t\t<td></td>"
-
-    try:
-        print "\t\t<td>" + tag.getTitle() + "</td>"
-    except UnicodeEncodeError:
-        print "\t\t<td></td>"
+    print("\t<tr>")
 
+    print("\t\t<td>" + tag.getArtist().encode("UTF8") + "</td>\n")
+    print("\t\t<td>" + tag.getAlbum().encode("UTF-8") + "</td>")
+    print("\t\t<td>" + tag.getTitle().encode("UTF-8") + "</td>")
 
     comments = tag.getComments()
     strComments = ""
@@ -87,19 +93,19 @@ for f in files:
 
         curator = m.group(3)
 
-        copyright = fma_copyright_to_html(m.group(4))
+        copyright = fma_copyright_to_html(f, m.group(4))
 
-    print "\t\t<td>" + url + "</td>"
-    print "\t\t<td>" + curator + "</td>"
-    print "\t\t<td>" + copyright + "</td>"
-    print "\t\t<td>" + strComments + "</td>"
+    print("\t\t<td>" + url + "</td>")
+    print("\t\t<td>" + curator + "</td>")
+    print("\t\t<td>" + copyright + "</td>")
+    print("\t\t<td>" + strComments + "</td>")
 
-    print "\t</tr>"
+    print("\t</tr>")
 
-print "</table>"
-print "<footer>"
-print "            <ul>"
-print "                    <li><a href=\"mailto:proxyradio@wpitchoune.net\">Contact</a></li>"
-print "            </ul>"
-print "</footer>"
-print "</body></html>"
+print("</table>")
+print ("            <ul>")
+print ("<footer>")
+print ("                    <li><a href=\"mailto:proxyradio@wpitchoune.net\">Contact</a></li>")
+print ("            </ul>")
+print( "</footer>")
+print( "</body></html>")