最後還是選擇了brat,原因有下邊幾個
- 資料隻能放在伺服器端,不能導出
- 實體标注操作還算友善
- 沒有找到其他更适合的标注工具
今天對brat的安裝和部署做一個小結,參考的網頁有:
http://brat.nlplab.org/installation.html
https://blog.csdn.net/QFire/article/details/82496718
1. ubuntu虛拟機的安裝
由于brat隻能部署在類unix系統上,是以這裡選擇在Windows上安裝Ubuntu14.04的虛拟機。會安裝虛拟機的小夥伴,直接跳到2。
步驟1到開源鏡像站下載下傳Ubuntu14.04鏡像。位址為http://mirrors.163.com/ubuntu-releases/14.04/ubuntu-14.04.6-desktop-amd64.iso直接複制該位址到迅雷即可下載下傳。
步驟2下載下傳virtualbox虛拟機,安裝過程全部點選下一步。位址:https://download.virtualbox.org/virtualbox/6.0.6/VirtualBox-6.0.6-130049-Win.exe直接複制該位址到迅雷即可下載下傳。
步驟3在虛拟機virtualbox中安裝ubuntu14.04。virtualbox點選`建立`輸入ubuntu後自動填寫後邊的選項,這裡我輸入的是“ubuntu_annotato”,一路下一步,選擇記憶體4G(筆記本記憶體太小選擇2G或1G),選擇磁盤空間大小,越大越好,我設定為“128G”。建立好虛拟機後,右鍵虛拟機圖示,點選`設定`->`存儲`->配置設定光驅的CD光牒圖示,選擇
步驟1下載下傳的CD光牒鏡像。設定好後點選`啟動`。選擇語言“中文(簡體)”,點選`安裝Ubuntu`,一路`繼續`直到輸入姓名等輸入項,自行輸入,這頁的内容最好自己記住,之後就開始自動安裝了。這裡我設定的使用者名為“annotator”,密碼為“123456”。安裝完成後,重新開機即可。啟動進入系統後,需要安裝一下增強功能。設定共享檔案夾,以及雙向剪貼闆。把目前使用者添追加到vboxsf組,以使目前使用者具有通路權限
$ sudo usermod -aG vboxsf $(whoami)
步驟4 設定靜态IP。此步與本次部署沒有關系,隻是為了以後用windows下的終端連接配接友善。先使虛拟機處于關閉狀态,右擊虛拟機圖示,點選`設定`->`網絡`,網卡1設定為“網絡位址轉換(NAT)”,網卡2設定為“僅主機(Host-Only)擴充卡。設定virtualbox“主機網絡管理擴充卡”,點選`管理`->`主機網絡管理器`按下圖設定
啟動虛拟機,編輯/etc/network/interfaces檔案。添加下邊圖中的内容
重新開機。安裝遠端登陸服務ssh-server,sudo apt-get install openssh-server輸入自己在前邊設定的密碼。完成遠端登陸如下圖所示
2. 安裝apache2.x
由于brat是基于web的,是以需要安裝apache服務。
步驟1安裝apache
$ sudo apt-get install apache2
注意:apache成功安裝後預設根目錄為/var/www/html。
步驟2修改apache配置檔案,這裡主要是修改配置檔案apache2.conf中的“<Directory /var/www/>”這一項,在這一項内部添加brat官網的配置項内容,修改後的内容是下邊這樣的,這裡我就不解釋了,因為我也不明白每一項内容代表什麼意思,不會Web開發。
$ cd /etc/apache2/
先備份一下吧,以免誤改後恢複不到原始内容了。
$ sudo cp apache2.conf apache2.conf.bak
編輯apache2.conf
$ sudo vi apache2.conf
把配置檔案apache2.conf中“<Directory /var/www/>”這一部分的内容改成下邊的樣子
<Directory /var/www/>
Options Indexes FollowSymLinks
Require all granted
AllowOverride Options Indexes FileInfo Limit
AddType application/xhtml+xml .xhtml
AddType font/ttf .ttf
# For CGI support
AddHandler cgi-script .cgi
# Comment out the line above and uncomment the line below for FastCGI
#AddHandler fastcgi-script fcgi
</Directory>
這裡如果使用普通cgi就設定普通cgi,如果使用fastcgi就注釋掉普通cgi那行,打開fastcgi那行。
在配置檔案apache2.conf的結尾添加服務名
ServerName localhost
添加服務名的原因是因為在啟動服務時總警告說“* Restarting web server apache2
AH00558: apache2: Could not reliably determine the server's fully qualified domain name, using 127.0.1.1. Set the 'ServerName' directive globally to suppress this message”,雖然隻是個警告,但是還是添加一下消除掉這個警報吧。
步驟3使能userdir(為啥不知道)
$ sudo a2enmod userdir
Enabling module userdir.
To activate the new configuration, you need to run:
service apache2 restart
步驟4 如果使用普通cgi,則啟用
$ sudo a2enmod cgi
Your MPM seems to be threaded. Selecting cgid instead of cgi.
Module cgid already enabled
步驟5 如果用FASTCGI支援,則安裝并使能rewrite子產品((4)、(5)選擇一個就行,根據前邊配置檔案apache2.conf中的設定)
$ sudo apt-get install libapache2-mod-fastcgi
$ sudo a2enmod fastcgi
Module fastcgi already enabled
$ sudo a2enmod rewrite
Enabling module rewrite.
To activate the new configuration, you need to run:
步驟6 啟動apache服務
$ sudo service apache2 restart
* Restarting web server apache2
...done.
如果安裝成功,則可以通過http://192.168.142.15 或http://localhost通路apache預設頁,如下圖所示:ip位址192.168.142.15為虛拟機位址
3. 安裝并配置BRAT
步驟1下載下傳BRAT http://weaver.nlplab.org/~brat/releases/brat-v1.3_Crunchy_Frog.tar.gz
步驟2将軟體安裝包複制到apache根目錄,解壓,修改檔案名為brat
$ cd /var/www/html
$ sudo cp /media/sf_Downloads/brat-v1.3_Crunchy_Frog.tar.gz /var/www/html/
$ sudo tar -xvzf brat-v1.3_Crunchy_Frog.tar.gz
$ sudo mv brat-v1.3_Crunchy_Frog brat
步驟3 進入brat目錄,并啟動安裝腳本,輸入使用者名、密碼以及郵箱位址。
$ cd /var/www/html/brat
$ sudo ./install.sh
Please the user name that you want to use when logging into brat
editor
Please enter a brat password (this shows on screen)
annotate
Please enter the administrator contact email
[email protected]
Assigning owner of the following directories to apache (www-data):
"/var/www/html/brat/work/" and "/var/www/html/brat/data/"
(this requires sudo; please enter your password if prompted)
The installation has finished, you are almost done.
1.) If you are installing brat on a webserver, make sure you have
followed the steps described in the brat manual to enable CGI:
http://brat.nlplab.org/installation.html
2.) Please verify that brat is running by accessing your installation
using a web browser.
You can automatically diagnose some common installation issues using:
tools/troubleshooting.sh URL_TO_BRAT_INSTALLATION
If there are issues not detected by the above script, please contact the
brat developers and/or file a bug to the brat bug tracker:
https://github.com/nlplab/brat/issues
3.) Once brat is running, put your data in the data directory. Or use
the example data placed there by the installation:
/var/www/html/brat/data
4.) You can find configuration files to place in your data directory in
the configurations directory, see the manual for further details:
/var/www/html/brat/configurations
5.) Then, you (and your team?) are ready to start annotating!
步驟4 檢視apache組名(
步驟4、
步驟5兩步應該不需要,目前版本的brat在安裝完成後會自動進行這兩步操作)
$ sudo ./apache-group.sh
www-data
步驟5 改變data、work目錄及其下所有子目錄和檔案的所屬組為www-data,使得apache可以有權限通路和修改
$ sudo chmod -R g+rwx data work
檢視是否生效
$ ls -lh | grep data
drwxrwxr-x 4 root www-data 4.0K 5月 6 23:29 data
$ ls -lh | grep work
drwxrwxr-x 2 root www-data 4.0K 5月 6 23:29 work
步驟6 打開網頁,測試是否安裝成功,如果成功,位址欄輸入http://192.168.142.15/brat或http://localhost/brat可以看到下邊的頁面
至此,brat的安裝與部署全部完成。關于配置,将在以後介紹。不過說實話,這個界面我也不喜歡,一點兒都不好看。